Критерий асимметрии и эксцесса. Асимметрия и эксцесс распределения случайной величины

Для получения приблизительного представления о форме распределения случайной величины строят график её ряда распределения (полигон и гистограмму), функции или плотности распределения. В практике статистических исследований приходится встречаться с самими различными распределениями. Однородные совокупности характеризуются, как правило, одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности. В этом случае необходима перегруппировка данных с целью выделения более однородных групп.

Выяснение общего характера распределения случайной величины предполагает оценку степени его однородности, а также исчисление показателей асимметрии и эксцесса. В симметричном распределении, в котором математическое ожидание равно медиане, т.е. , можно считать асимметрия отсутствует. Но чем заметнее асимметрия, тем больше отклонение между характеристиками центра распределения – математическим ожиданием и медианой.

Простейшим коэффициентом асимметрии распределения случайной величины можно считать , где - это математическое ожидание, - медиана, а - стандартное отклонение случайной величины.

В случае правосторонней асимметрии , левосторонней – . Если , считается, что асимметрия низкая, если – средняя, а при – высокая. Геометрическая иллюстрация правосторонней и левосторонней асимметрии приведена на рисунке ниже. На нём изображены графики плотности распределений соответствующих типов непрерывных случайных величин.

Рисунок. Иллюстрация правосторонней и левосторонней асимметрии на графиках плотностей распределений непрерывных случайных величин.

Существует и другой коэффициент асимметрии распределения случайной величины. Можно доказать, что отличие от нуля центрального момента нечётного порядка свидетельствует об асимметрии распределения случайной величины. В предыдущем показателе мы использовали выражение , аналогичное моменту первого порядка . Но обычно в этом другом коэффициенте асимметрии используют центральный момент третьего порядка , а для того, чтобы этот коэффициент стал безразмерным его делят на куб стандартного отклонения. Получается такой коэффициент асимметрии: . Для этого коэффициента асимметрии, как и для первого в случае правосторонней асимметрии , левосторонней – .

Эксцесс случайной величины

Эксцесс распределения случайной величины характеризует степень сосредоточенности её значений около центра распределения: чем более высокая такая сосредоточенность, тем выше и уже будет график плотности её распределения. Показатель эксцесса (островершинности) рассчитывается по формуле: , где - это центральный момент 4 порядка, а – это стандартное отклонение, возведённое в 4 степень. Поскольку степени числителя и знаменателя одинаковы эксцесс является безразмерной величиной. При этом принято за эталон отсутствия эксцесса, нулевого эксцесса, брать нормальное распределение. Но можно доказать, что для нормального распределения . Поэтому в формуле для вычисления эксцесса из этой дроби число 3 вычитается.

Таким образом, для нормального распределения эксцесс равен нулю: . Если эксцесс больше нуля, т.е. , то распределение более островершинное, чем нормальное. Если эксцесс меньше нуля, т.е. , то распределение менее островершинное, чем нормальное. Предельным значением отрицательного эксцесса является значение ; величина положительного эксцесса может быть бесконечно большой. Как выглядят графики островершинных и плосковершинных плотностей распределения случайных величин в сравнении с нормальным распределением, показано на рисунке.

Рисунок. Иллюстрация островершинных и плосковершинных плотностей распределения случайных величин в сравнении с нормальным распределением.

Асимметрия и эксцесс распределения случайной величины показывают, насколько она отклоняется от нормального закона. При больших асимметриях и эксцессах применять формулы вычислений для нормального распределения не следует. Каким является уровень допустимости асимметрии и эксцесса для использования формул нормального распределения в анализе данных конкретной случайной величины должен определять исследователь на основе своих знаний и опыта.

При анализе вариационных рядов смещение от центра и крутизну распределения характеризуют специальные показатели. Эмпирические распределения, как правило, смещены от центра распределения вправо или влево, асимметричны. Нормальное распределение строго симметрично относительно средней арифметической, что обусловлено четностью функции.

Асимметрия распределения возникает вследствие того, что какие-либо факторы действуют в одном направлении сильнее, чем в другом, или процесс развития явления таков, что доминирует какая-то причина. Кроме того, природа некоторых явлений такова, что имеет место асимметричное распределение.

Наиболее простой мерой асимметрии является разность между средней арифметической, модой и медианой:

Для определения направления и величины смещения (асимметрии) распределения рассчитывается коэффициент асимметрии , представляющий собой нормированный момент третьего порядка:

As= 3 / 3 , где  3 – центральный момент третьего порядка;  3 –среднее квадратическое отклонение в кубе. 3 = (m 3 – 3m 1 m 2 + 2m 1 3)k 3 .

При левосторонней асимметрии коэффициент асимметрии (As<0), при правосторонней (As>0) .

Если вершина распределения сдвинута влево и правая часть ветви оказывается длиннее левой, то такая асимметрия является правосторонней, в противоположном случае левосторонней .

Соотношение между модой, медианой и средней арифметической в симметричном и асимметричном рядах позволяет в качестве меры асимметрии использовать более простой показатель коэффициента асимметрии Пирсона :

К a = (–Мо)/. Если К a >0, то асимметрия правосторонняя, если К a <0, то асимметрия левосторонняя, при К a =0 ряд считается симметричным.

Более точно асимметрию можно определить, используя центральный момент третьего порядка:

, где 3 = (m 3 – 3m 1 m 2 + 2m 1 3)k 3 .

Если > 0, то асимметрию можно считать значительной, если< 0,25 асимметрию можно считать не значительной.

Для характеристики степени отклонения симметричного распределения от нормального по ординате используется показатель островершинности, крутизны распределения, называемый эксцессом :

Ex = ( 4 / 4) – 3, где:  4 – центральный момент четвертого порядка.

Для нормального распределения Ех = 0, т.е.  4 / 4 = 3.  4 = (m 4 – 4m 3 m 1 + 6m 2 m 2 1 – 3 m 4 1)* k 4 .

У высоковершинных кривых эксцесс положительный, у низковершинных отрицательный (рис. Г.2).

Показатели эксцесса и асимметрии необходимы в статистическом анализе для определения неоднородности совокупности, асимметричности распределения и близости эмпирического распределения к нормальному закону. При значительных отклонениях показателей асимметрии и эксцесса от нуля нельзя признать совокупность однородной, а распределение близким к нормальному. Сопоставление фактических кривых с теоретическими позволяет математически обосновать полученные статистические результаты, установить тип и характер распределения социально-экономических явлений, прогнозировать вероятность появления изучаемых событий.

4.7. Обоснование близости эмпирического (фактического) распределения к теоретическому нормальному распределению. Нормальное распределение (закон Гаусса-Лапласа) и его характеристики. «Правило трех сигм». Критерии согласия (на примере критерия Пирсона или Колгомогорова).

Можно заметить определенную связь в изменении частот и значений варьирующего признака. Частоты с ростом значения признака сначала увеличиваются, а затем после достижения какой-то максимальной величины уменьшаются. Такие закономерные изменения частот в вариационных рядах называются закономерностями распределения .

Для выявления закономерности распределения необходимо, чтобы вариационный ряд содержал достаточно большое количество единиц, а сами ряды представляли собой качественно однородные совокупности.

Построенный по фактическим данным полигон распределения - это эмпирическая (фактическая) кривая распределения , отражающая не только объективные (общие), но и субъективные (случайные) условия распределения, не характерные для изучаемого явления.

В практической работе закон распределения находят путем сравнения эмпирического распределения с одним из теоретических и оценки степени различия или соответствия между ними. Теоретическая кривая распределения отражает в чистом виде, без учета влияния случайных факторов, общую закономерность распределения частот (плотности распределения) в зависимости от значений варьирующих признаков.

В статистике распространены различные виды теоретических распределений: нормальное, биномиальное, Пуассона и др. Каждое из теоретических распределений имеет свою специфику и область применения.

Закон нормального распределения характерен для распределения равновероятных событий, происходящих при взаимодействии множества случайных факторов. Закон нормального распределения лежит в основе статистических методов оценки параметров распределения, репрезентативности выборочных наблюдений, измерения взаимосвязи массовых явлений. Для проверки, насколько фактическое распределение соответствует нормальному, необходимо сравнить частоты фактического распределения с теоретическими частотами, характерными для нормального закона распределения. Эти частоты являются функцией нормированных отклонений. Поэтому по данным эмпирического ряда распределения вычисляют нормированные отклонения t. Затем определяют соответствующие им теоретические частоты. Таким образом, выравнивается эмпирическое распределение.

Нормальное распределение или закон Гаусса-Лапласа описывается уравнением
, где y t – ордината кривой нормального распределения, или частость (вероятность) величины х нормального распределения; – математическое ожидание (среднее значение) индивидуальных значений х. Если значения (х – ) измерить (выразить) в величинах среднего квадратического отклонения , т.е. в стандартизованных (нормированных) отклонениях t = (x – )/, то формула примет вид:
. Нормальное распределение социально-экономических явлений в чистом виде встречается редко, однако, если соблюдена однородность совокупности, часто фактические распределения близки к нормальному. Закономерность распределения изучаемых величин выявляют посредством проверки соответствия эмпирического распределения теоретически нормальному закону распределения. Для этого фактическое распределение выравнивается по кривой нормального и рассчитываются критерии согласия .

Нормальное распределение характеризуется двумя существенными параметрами, определяющими центр группирования индивидуальных значений и форму кривой: средней арифметической и средним квадратическим отклонением . Кривые нормального распределения различаются положением на оси абсцисс центра распределения и разбросом вариант около этого центра  (рис. 4.1 и 4.2). Особенностью кривой нормального распределения является ее симметричность относительно центра распределения – по обе стороны от ее середины образуются две равномерно убывающие ветви, асимптотически приближающиеся к оси абсцисс. Поэтому при нормальном распределении средняя, мода и медиана совпадают: = Мо = Ме.

x

Кривая нормального распределения имеет две точки перегиба (переход от выпуклости к вогнутости) при t = 1, т.е. при отклонении вариантов от средней (х – ), равном среднему квадратическому отклонению . В пределах  при нормальном распределении заключается 68,3%, в пределах 2 – 95,4%, в пределах 3 – 99,7% количества наблюдений или частот ряда распределения. На практике почти не встречаются отклонения, превышающие 3поэтому приведенное соотношение называется «правилом трех сигм ».

Для расчета теоретических частот применяется формула:

Величина
есть функция от t или плотность нормального распределения, которая определяется по специальной таблице, выдержки из которой приведены в табл. 4.2.

Значения плотности нормального распределения Таблица 4.2

График на рис. 4.3 наглядно демонстрирует близость эмпирического (2) и нормального (1) распределений.

Рис. 4.3. Распределения филиалов почтовой связи по численности

работников: 1 – нормальное; 2 – эмпирическое

Для математического обоснования близости эмпирического распределения закону нормального распределения рассчитываются критерии согласия .

Критерий Колмогорова - критерий согласия, позволяющий оценить степень близости эмпирического распределения к нормальному. А. Н. Колмогоров предложил для определения соответствия между эмпирическим и теоретическим нормальным распределениями использовать максимальную разность накопленных частот или частостей этих рядов. Для проверки гипотезы о соответствии эмпирического распределения закону нормального распределения рассчитывают критерий согласия = D/
, где D – максимальная разность между кумулятивными (накопленными) эмпирическими и теоретическими частотами, n – численность единиц совокупности.По специальной таблице определяют Р() – вероятность достижения , которая означает, что если вариационный признак распределен по нормальному закону, то из-за случайных причин максимальное расхождение между эмпирическими и теоретическими накопленными частотами будет не меньшим, чем фактически наблюденное. На основании значения Р() делают определенные выводы: если вероятность Р() достаточно велика, то гипотезу о соответствии фактического распределения нормальному закону можно считать подтвержденной; если вероятность Р() мала, то нулевая гипотеза отвергается, расхождения между фактическим и теоретическим распределениями признаются существенными.

Значения вероятностей для критерия согласия  Таблица 4.3

Критерии Пирсона  2 ("хи-квадрат") - критерий согласия, позволяющий оценить степень близости эмпирического распределения к нормальному:
,где f i , f" i – частоты эмпирического и теоретического распределений в определенном интервале. Чем больше разность между наблюдаемыми и теоретическими частотами, тем больше критерий  2 . Чтобы отличить существенность различий частот эмпирического и теоретического распределений по критерию  2 от различий в результате случайностей выборки, рассчитанное значение критерия  2 расч сравнивают с табличным  2 табл при соответствующем числе степеней свободы и заданном уровне значимости. Уровень значимости выбирается так, что Р( 2 расч > 2 табл)=. Число степеней свободы равно h –l , где h – число групп; l – число условий, которые должны выполняться при вычислении теоретических частот. Для расчета теоретических частот кривой нормального распределения по формуле
необходимо знать три параметра , , f, поэтому число степеней свободы равно h–3. Если  2 расч > 2 табл, т.е.  2 попадает в критическую область, то расхождение между эмпирическими и теоретическими частотами существенно и его нельзя объяснить случайными колебаниями выборочных данных. В этом случае нулевая гипотеза отвергается. Если  2 расч  2 табл, т.е. рассчитанный критерий не превышает максимально возможное расхождение частот, которое может возникнуть в силу случайности, то в данном случае гипотеза о соответствии распределений принимается. Критерий Пирсона эффективен при значительном числе наблюдений (n50), причем частоты всех интервалов должны насчитывать не менее пяти единиц (при меньшем количестве интервалы объединяют), а число интервалов (групп) должно быть большим (h>5), поскольку оценка  2 зависит от числа степеней свободы.

Критерий Романовского - критерий согласия, позволяющий оценить степень близости эмпирического распределения к нормальному.В.И. Романовский предложил близость эмпирического распределения к кривой нормального распределения оценивать по отношению:

, где h – число групп.

Если отношение больше 3, то расхождение частот эмпирического и нормального распределений нельзя признать случайным и гипотезу о нормальном законе распределения следует отвергнуть. Если отношение меньше или равно 3, то можно принять гипотезу о нормальном характере распределения данных.

2.6 Асимметрия и эксцесс

В математической статистике для выяснения геометрической формы плотности вероятности случайной величины используются две числовые характеристики, связанные с центральными моментами третьего и четвертого порядков.

Определение 2.22 Коэффициентом асимметрии выборки x 1 , x 2 , …, x n называется число , равное отношению центрального выборочного момента третьего порядка к кубу стандартного отклонения S :

Так как и , то коэффициент асимметрии выражается через центральные моменты следующей формулой:

Отсюда получается формула, выражающая коэффициент асимметрии через начальные моменты:

, которая облегчает практические вычисления.

Соответствующая теоретическая характеристика вводится с помощью теоретических моментов.

Определение 2.23 Коэффициентом асимметрии случайной величины X называется число равное отношению центрального момента третьего порядка к кубу стандартного отклонения :

Если случайная величина X имеет симметричное распределение относительно математического ожидания μ, то её теоретический коэффициент асимметрии равен 0, если же распределение вероятностей несимметрично, то коэффициент асимметрии отличен от нуля. Положительное значение коэффициента асимметрии говорит о том, что большая часть значений случайной величины расположена правее математического ожидания, то есть правая ветвь кривой плотности вероятности более удлинена, чем левая. Отрицательное значение коэффициента асимметрии говорит о том, что более длинная часть кривой расположена слева. Данное утверждение иллюстрирует следующий рисунок.

Рисунок 2.1 – Положительная и отрицательная асимметрия

распределений

Пример 2.29 Найдем выборочный коэффициент асимметрии по данным исследования стрессовых ситуаций из примера 2.28.

Пользуясь ранее вычисленными значениями центральных выборочных моментов, получим

Округлим = 0,07. Найденное отличное от нуля значение коэффициента асимметрии показывает скошенность распределения относительно среднего. Положительное значение говорит о том, что более длинная ветвь кривой плотности вероятности расположена справа.

Особенности распределения значений случайной величины вокруг её модального значения Х мод характеризует следующая постоянная.

Определение 2.24 Эксцессом выборки x 1 , x 2 , …, x n называется число , равное

где – выборочный центральный момент четвёртого порядка,

S 4 – четвёртая степень стандартного отклонения S .

Теоретическое понятие эксцесса является аналогом выборочного.

Определение 2.25 Эксцессом случайной величины X называется число е, равное

где – теоретический центральный момент четвёртого порядка,

–четвёртая степень стандартного отклонения .

Значение эксцесса е характеризует относительную крутость вершины кривой плотности распределения вокруг точки максимума. Если эксцесс является положительным числом, то соответствующая кривая распределения имеет более острую вершину. Распределение с отрицательным эксцессом имеет сглаженную и более плоскую вершину. Следующий рисунок иллюстрирует возможные случаи.

Рисунок 2.2 – Распределения с положительным, нулевым и отрицательным значениями эксцессов

При анализе распределения численностей значительный интерес представляет оценка отклонения данного распределения от симметричного, или, иначе говоря, его скошенность. Степень скошенности (асимметрия) является одним из наиболее важных свойств распределения численностей. Существует целый ряд статистических показателей, предназначенных для вычисления асимметрии. Все они отвечают как минимум двум требованиям, предъявляемым к любому показателю скошенности: он должен быть безразмерным и равным нулю, если распределение симметрично.

На рис. 2 а, б приведены кривые двух асимметричных распределений численностей, одна из которых скошена влево, а другая -вправо. Качественно показано взаимное расположение моды, медианы и среднего. Видно, что один из возможных показателей скошенности может быть построен с учетом расстояния на котором находятся друг от друга средняя и мода. Но учитывая сложность определения моды по эмпирическим данным, а с другой стороны, известное соотношение (3) между модой, медианой и средним, была предложена следующая формула для вычисления показателя асимметрии:

Из этой формулы следует, что распределения скошенные влево, имеют положительную асимметрию, а скошенные вправо - отрицательную. Естественно, что для симметричных распределений, для которых среднее и медиана совпадают, асимметрия равна нулю.

Вычислим показатели асимметрии для данных, приведенных в табл. 1 и 2. Для распределения длительности сердечного цикла имеем:

Таким образом, это распределение имеет небольшую левостороннюю скошенность. Полученное значение для асимметрии является приближенным, а не точным, так как для ее расчета использовались значения и, рассчитанные упрощенным способом.

Для распределения сульфгидрильных групп сыворотки крови имеем:

Таким образом, это распределение имеет отрицательную асимметрию, т.е. скошено вправо.

Теоретически показано, что величина, определяемая по формуле 13, лежит в пределах 3. Но практически эта величина очень редко достигает своих предельных значений, и для умеренно асимметричных одновершинных распределений она по модулю обычно меньше единицы.

Показатель асимметрии может быть использован не только для формального описания распределения численностей, но и для содержательной интерпретации полученных данных.

В самом деле, если наблюдаемый нами признак формируется под воздействием большого числа независимых друг от друга причин, каждая из которых вносит относительно небольшой вклад в величину этого признака, то в соответствии с некоторыми теоретическими предпосылками, обсуждавшимися в разделе по теории вероятностей, мы вправе ожидать, что получаемое в результате эксперимента распределение численностей будет симметричным. Однако, если для экспериментальных данных получена значительная величина асимметрии (численное значение As по модулю в пределах нескольких десятых), то можно предположить, что условия, указанные выше, не соблюдаются.

В этом случае имеет смысл предположить либо существование какого-то одного или двух факторов, вклад которых в формирование наблюдаемой в эксперименте величины существенно больше, чем остальных, либо постулировать наличие специального механизма, отличного от механизма независимого влияния множества причин на величину наблюдаемого признака.

Так, например, если изменения интересующей нас величины, соответствующие действию некоторого фактора, пропорциональны самой этой величине и интенсивности действия причины, то получаемое при этом распределение будет всегда скошено влево, т.е. иметь положительную асимметрию. С таким механизмом сталкиваются, например, биологи, оценивая величины, связанные с ростом растений и животных.

Другой способ оценки асимметрии основан на методе моментов, который будет обсуждаться в главе 44. В соответствии с этим методом для расчета асимметрии используют сумму отклонений всех значений ряда данных относительно средней, возведенных в третью степень, т.е.:

Третья степень обеспечивает равенство нулю числителя этого выражения для симметричных распределений, так как в этом случае суммы отклонений в большую и меньшую сторону от средней в третьей степени будут равны и иметь противоположные знаки. Деление на обеспечивает безразмерность для показателя асимметрии.

Формула (14) может быть преобразована следующим образом. В предыдущем параграфе были введены стандартизованные величины:

Таким образом, мера скошенности представляет собой среднее значение стандартизованных данных, возведенных в куб.

Для тех же данных, для которых по формуле (13) была рассчитана асимметрия, найдем показатель по формуле (15). Имеем:

Естественно, что показатели асимметрии, вычисленные по разным формулам, отличаются друг от друга по величине, но одинаково указывают на характер скошенности. В пакетах прикладных программ для статистического анализа при расчете асимметрии используют формулу (15), как дающую более точные значения. Для предварительных же расчетов с использованием простейших калькуляторов можно пользоваться формулой (13).

Эксцесс. Итак, мы рассмотрели три из четырех групп показателей, с помощью которых описываются распределения численностей. Последней из них является группа показателей островершинности, или эксцесса (от греческого - горбатый). Для вычисления одного из возможных показателей эксцесса используется следующая формула:

Используя тот же подход, который был применен при преобразовании формулы асимметрии (14) легко показать, что:

Теоретически было показано, что величина эксцесса для нормальной (гауссовой) кривой распределения, играющей в статистике, также как и в теории вероятностей большую роль, численно равна 3. Исходя из целого ряда соображений заостренность этой кривой принимают за стандарт, и поэтому в качестве показателя эксцесса используют величину:

Найдем значение островершинности для данных, приведенных в табл. 1. Имеем:

Таким образом, кривая распределения длительности сердечных циклов уплощена по сравнению с нормальной кривой, для которой.

В табл. 3 приведено распределение числа краевых цветков у одного из видов хризантем. Для этого распределения

Эксцесс может принимать очень большие значения, как это видно из приведенного примера, но его нижняя граница не может быть меньше единицы. Оказывается, что если распределение двувершинно (бимодально), то значение эксцесса приближается к своей нижней границе, так что стремится к -2. Таким образом, если в результате расчетов оказывается, что значение меньше -1-1,4, можно быть уверенным, что имеющиеся в нашем распоряжении распределение численностей по крайней мере бимодально. Это особенно важно учитывать, когда экспериментальные данные, минуя стадию предварительной обработки, анализируются с помощью ЦВМ и перед глазами исследователя нет непосредственно графического изображения распределения численностей.

Двувершинность кривой распределения опытных данных может возникать по многим причина. В частности, такое распределение может появиться за счет объединения в единую совокупность двух наборов разнородных данных. Для иллюстрации этого мы искусственно объединили данные о ширине раковин двух видов ископаемых моллюсков в одну совокупность (табл. 4, рис. 3).

На рисунке явно видно наличие двух мод, так как смешаны два набора данных из разных совокупностей. Расчет дает для величины эксцесса 1,74, и, следовательно, =-1,26. Таким образом, расчетная величина показателя островершинности указывает, в соответствии с ранее высказанным положением, что распределение имеет две вершины.

Здесь нужно сделать одно предостережение. Действительно, во всех случаях, когда распределение численностей будет иметь два максимума, величина эксцесса будет близка к единице. Однако из этого факта нельзя автоматически делать вывод о том, что анализируемая совокупность данных представляет собой смесь двух разнородных выборок. Во-первых, такая смесь в зависимости от численности составляющих ее совокупностей может и не иметь двух вершин, и показатель эксцесса будет значительно больше единицы. Во-вторых, две моды может иметь и однородная выборка, если, например, нарушены требования к отбору экспериментальных данных. Таким образом, в этом, как, впрочем, и в других случаях вслед за формальным расчетом различных статистик должен осуществляться тщательный профессиональный анализ, который позволит дать полученным данным содержательную интерпретацию.

Асимметрия и эксцесс распределения случайной величины.

090309-matmetody.txt

Характеристики ассиметрии.

Основная мера ассиметрии - это коэффициент ассиметрии. То есть, степерь отклонения графика распределения частот от симметричного вида относительно среднего значения. Обозначается буквой A с индексом s и считается по формуле (рис 8). Коэффициент ассиметрии изменяется от минус бесконечности до плюс бесконечности. Ассиметрия бывает левосторонняя (положительная), когда коэффициент больше нуля - As>0 и правосторонняя (отрицательная) - As<0. При левосторонней ассиметрии чаще встречаются значения ниже среднего арифметического. При правой, соответственно чаще всего встречаются значения, превосходящие среднее арифметическое. Для симметричных распределений коэффициент ассиметрии равен нулю, а мода, медиана и среднее арифметическое значение совпадают между собой.

Характеристики эксцесса.

Характеризует его коэффициент эксцесса (или островершинности) - рассчитывается по формуле.

Островершинное распределение характеризуется положительным эксцессом, плосковершинное - отрицательным, средневершинное имеет нулевой эксцесс.

во-первых, во-вторых,

Если вы- (обычно - интер-вальной).

Графический способ (Q - Q Plots , Р-Р Plots ).

где N - объем выборки.

Свойства нормального распределения случайной величины.

090309-matmetody.txt

Нормальное распределение.

Нормальное распределение характеризуется тем, что крайние значения признаков встречаются относительно редко, близкие к среднему арифметическому - относительно часто. Кривая нормального распределения имеет колокообразную форму. Это одномодальное распределение, значения медианы, моды и среднего арифметического которого совпадают между собой, коэффициенты ассиметрии и эксцесса лежат в промежутке от нуля до двух (допустимое), но в идеале равны нулю.

Начиная со второй половины XIX столетия измерительные и вычислительные методы в психологии разрабатываются на основе следующего принципа. Если инди- видуальная изменчивость некоторого свойства есть следствие действия мно-жества причин, то распределение частот для всего многообразия проявлений этого свойства в генеральной совокупности соответствует кривой нормального распределения. Это и есть закон нормального распределения.

Закон нормального распределения имеет целый ряд очень важных след-ствий, к которым мы не раз еще будем обращаться. Сейчас же отметим, что если при изучении некоторого свойства мы произвели его измерение на вы-борке испытуемых и получили отличающееся от нормального распределение, то это значит, что либо выборка нерепрезентативна генеральной совокупно-сти, либо измерения произведены не в шкале равных интервалов.

К
аждому психологическому (или шире - биологическому) свойству соот-ветствует свое распределение в генеральной совокупности. Чаще всего оно является нормальным и характеризуется своими параметрами: средним (М) и стандартным отклонением (о). Только эти два значения отличают друг от дру-га бесконечное множество нормальных кривых, одинаковой формы, задан-ной уравнением (5.1). Среднее задает положение кривой на числовой оси и выступает как некоторая исходная, нормативная величина измерения. Стандар-тное отклонение задает ширину этой кривой, зависит от единиц измерения и выступает как масштаб измерения (рис. 5.3).

Рис 5.3. Семейство нормальных кривых, 1-е распределение отличается от 2-го стандартным отклонением (σ 1 < σ 2), 2-е от 3-го средним арифметическим (M 2 < M 3)

Все многообразие нормальных распределений может быть сведено к од-ной кривой, если применить ^-преобразование (по формуле 4.8) ко всем воз-можным измерениям свойств. Тогда каждое свойство будет иметь среднее 0 и стандартное отклонение 1. На рис. 5.4 построен график нормального распре-деления для М= 0 и а = 1. Это и есть единичное нормальное распределение, кото- рое используется как стандарт - эталон . Рассмотрим его важные свойства .

Единицей измерения единичного нормального распределения является стандартное отклонение.

Кривая приближается к оси Z по краям асимптотически - никогда не касаясь её.

Кривая симметрична относительно М=0. Её асимметрия и эксцесс равны нулю.

Кривая имеет характерный изгиб: точка перегиба лежит точно на расстоянии в одну σ от М.

Площадь между кривой и осью Z равна 1.

Последнее свойство объясняет название единичное нормальное распреде-ление и имеет исключительно важное значение. Благодаря этому свойству площадь под кривой интерпретируется как вероятность, или относительная частота. Действительно, вся площадь под кривой соответствует вероятности того, что признак примет любое значение из всего диапазона его изменчиво-сти (от -оо до +оо). Площадь под единичной нормальной кривой слева или справа от нулевой точки равна 0,5. Это соответствует тому, что половина ге-неральной совокупности имеет значение признака больше 0, а половина - меньше 0. Относительная частота встречаемости в генеральной совокупнос-ти значений признака в диапазоне от Z \ до Zi равна площади под кривой, ле-жащей между соответствующими точками. Отметим еще раз, что любое нор-мальное распределение может быть сведено к единичному нормальному распределению путем z - преобразования.

Итак, наиболее важным общим свойством разных кривых нормального распределения является одинаковая доля площади под кривой между одни-ми и теми же двумя значениями признака, выраженными в единицах стан-дартного отклонения.

Полезно помнить, что для любого нормального распределения существу-ют следующие соответствия между диапазонами значений и площадью под кривой:

Единичное нормальное распределение устанавливает четкую взаимосвязь стандартного отклонения и относительного количества случаев в генераль-ной совокупности для любого нормального распределения. Например, зная свойства единичного нормального распределения, мы можем ответить на сле-дующие вопросы. Какая доля генеральной совокупности имеет выраженность свойства от - \о до +1о? Или какова вероятность того, что случайно выбран-ный представитель генеральной совокупности будет иметь выраженность свойства, на За превышающую среднее значение? В первом случае ответом будет 68,26% всей генеральной совокупности, так как от - 1 до +1 содержится 0,6826 площади единичного нормального распределения. Во втором случае ответ: (100-99,72)/2 = 0,14%.

Существует специальная таблица, позволяющая определять площадь под кривой справа от любого положительного z (приложение 1). Пользуясь ею, можно определить вероятность встречаемости значений признака из любого диапазона. Это широко используется при интерпретации данных тестирования.

Несмотря на исходный постулат, в соответствии с которым свойства в ге-неральной совокупности имеют нормальное распределение, реальные дан-ные, полученные на выборке, нечасто распределены нормально. Более того, разработано множество методов, позволяющих анализировать данные без всякого предположения о характере их распределения как в выборке, так и в генеральной совокупности. Эти обстоятельства иногда приводят к ложному убеждению, что нормальное распределение - пустая математическая аб-стракция, не имеющая отношения к психологии. Тем не менее, как мы уви-дим в дальнейшем, можно указать по крайней мере на три важных аспекта применения нормального распределения:

Разработка тестовых шкал.

Проверка нормальности выборочного распределения для принятия ре-
шения о том, в какой шкале измерен признак - в метрической или по-
рядковой.

Статистическая проверка гипотез, в частности - при определении риска
принятия неверного решения.

Стандартное нормальное распределение. Стандартизация распределений.

(Весь вопрос №12 + о стандартизации см. ниже)

091208-matmetody.txt

Стандартизацией психодиагностических методов (об этом больше в вопросе №17)

Генеральная совокупность и выборка.

091208-matmetody.txt

Генеральные совокупности.

Любая психодиагностическая методика предназначена для обследования некоторой большой категории индивидумов. Это множество называется генеральной совокупностью.

Чтобы определить степень выраженности того или иного свойства у одного определённого человека, надо знать, как распределено это качество по всей генеральной совокупности. Обследовать генеральную совокупность практически невозможно, поэтому прибегают к извлечению из генеральной совокупности выборки, то есть некоторой представительной части генеральной совокупности. Именно эта представительность (по-другому её назывют "репрезентативность") является основным требованием к выборке. Обеспечить абсолютно точное совпадение данного требования невозможно. Можно лишь приблизиться к идеалу при помощи некоторых способов. Основные из них - 1) случайность и 2) моделирование.

1) Случайная выборка предполагает, что испытуемые попадут в неё случайным образом. Предпринимаются меры, чтобы исключить появление каких-либо закономерностей.

2) При моделировании сначала выбираются те свойства, которые могут повлиять на результаты тестирования. Обычно это демографические признаки, внутри которых выделяются градации: интервалы возрастов, уровни образования и т. д. По этим данным строится матричная модель генеральной совокупности.

Обычно методики стандартизируют на выборке от 200 до 800 человек.

Стандартизацией психодиагностических методов называется процедура получения шкалы, позволяющей сравнивать индивидуальный результат по тесту с результатами большой группы.

Исследование обычно начинается с некоторого предположения, требую-щего проверки с привлечением фактов. Это предположение - гипотеза - формулируется в отношении связи явлений или свойств в некоторой сово-купности объектов.

Для проверки подобных предположений на фактах необходимо измерить соответствующие свойства у их носителей. Но невозможно измерить тревож-ность у всех женщин и мужчин, как невозможно измерить агрессивность у всех подростков. Поэтому при проведении исследования ограничиваются лишь относительно небольшой группой представителей соответствующих совокупностей людей.

Генеральная совокупность - это все множество объектов, в отношении ко-торого формулируется исследовательская гипотеза.

В первом примере такими генеральными совокупностями являются все мужчины и все женщины. Во втором - все подростки, которые смотрят теле-передачи, содержащие сцены насилия. Генеральные совокупности, в отно-шении которых исследователь собирается сделать выводы по результатам ис-следования, могут быть по численности и более скромными.

Таким образом, генеральная совокупность - это хотя и не бесконечное пс численности, но, как правило, недоступное для сплошного исследования мно-жество потенциальных испытуемых.

Выборка - это ограниченная по численности группа объектов (в психоло-гии - испытуемых, респондентов), специально отбираемая из генеральной совокупности для изучения ее свойств. Соответственно, изучение на выбор-ке свойств генеральной совокупности называется выборочным исследованием. Практически все психологические исследования являются выборочными, а их выводы распространяются на генеральные совокупности.

Таким образом, после того, как сформулирована гипотеза и определены соответствующие генеральные совокупности, перед исследователем возни-кает проблема организации выборки. Выборка должна быть такой, чтобы была обоснована генерализация выводов выборочного исследования - обобщение, распространение их на генеральную совокупность. Основные критерии обо- снованности выводов исследования - это репрезентативность выборки и ста- тистическая достоверность (эмпирических) результатов.

Репрезентативность выборки - иными словами, ее представительность - это способность выборки представлять изучаемые явления достаточно пол-но-с точки зрения их изменчивости в генеральной совокупности.

Конечно, полное представление об изучаемом явлении, во всем его диапа-зоне и нюансах изменчивости, может дать только генеральная совокупность. Поэтому репрезентативность всегда ограничена в той мере, в какой ограни-чена выборка. И именно репрезентативность выборки является основным кри-терием при определении границ генерализации выводов исследования. Тем не менее, существуют приемы, позволяющие получить достаточную для ис-следователя репрезентативность выборки. (Вопрос №15 является продолжением этого вопроса)

Основные способы формирования выборки.

с. 13 (20) (Вопрос №14 является прелюдией к этому вопросу)

Первый и основной прием - это простой случайный (рандомизированный) отбор. Он предполагает обеспечение таких условий, чтобы каждый член генеральной совокупности имел равные с другими шансы попасть в выборку. Слу-чайный отбор обеспечивает возможность попадания в выборку самых разных представителей генеральной совокупности. При этом принимаются специ-альные меры, исключающие появление какой-либо закономерности при отборе. И это позволяет надеяться на то, что в конечном итоге в выборке изу-чаемое свойство будет представлено если и не во всем, то в максимально воз-можном его многообразии.

Второй способ обеспечения репрезентативности - это стратифицирован-ный случайный отбор, или отбор по свойствам генеральной совокупности. Он предполагает предварительное определение тех качеств, которые могут вли-ять на изменчивость изучаемого свойства (это может быть пол, уровень дохо-да или образования и т. д.). Затем определяется процентное соотношение чис-ленности различающихся по этих качествам групп (страт) в генеральной совокупности и обеспечивается идентичное процентное соотношение соот-ветствующих групп в выборке. Далее в каждую подгруппу выборки испытуе-мые подбираются по принципу простого случайного отбора.

Статистическая достоверность, или статистическая значимость, результа-тов исследования определяется при помощи методов статистического выво-да. Эти методы мы будем подробно рассматривать во второй части этой кни-ги. Сейчас лишь отметим, что они предъявляют определенные требования к численности, или объему выборки.

К сожалению, строгих рекомендаций по предварительному определению требуемого объема выборки не существует. Более того, ответ на вопрос о не-обходимой и достаточной ее численности исследователь обычно получает слишком поздно - только после анализа данных уже обследованной выбор-ки. Тем не менее, можно сформулировать наиболее общие рекомендации:

□ Наибольший объем выборки необходим при разработке диагностичес-кой методики - от 200 до 1000-2500 человек.

Если необходимо сравнивать 2 выборки, их общая численность должна
быть не менее 50 человек; численность сравниваемых выборок должна
быть приблизительно одинаковой.

П Если изучается взаимосвязь между какими-либо свойствами, то объем выборки должен быть не меньше 30-35 человек.

□ Чем больше изменчивость изучаемого свойства, тем больше должен быть
объем выборки. Поэтому изменчивость можно уменьшить, увеличивая
однородность выборки, например, по полу, возрасту и т. д. При этом,
естественно, уменьшаются возможности генерализации выводов.

Зависимые и независимые выборки. Обычна ситуация исследования, когда интересующее исследователя свойство изучается на двух или более выборках с целью их дальнейшего сравнения. Эти выборки могут находиться в различ-ных соотношениях - в зависимости от процедуры их организации. Независи- мые выборки характеризуются тем, что вероятность отбора любого испытуе-мого одной выборки не зависит от отбора любого из испытуемых другой выборки. Напротив, зависимые выборки характеризуются тем, что каждому испытуемому одной выборки поставлен в соответствие по определенному критерию испытуемый из другой выборки.

В общем случае зависимые выборки предполагают попарный подбор ис-пытуемых в сравниваемые выборки, а независимые выборки - независимый отбор испытуемых.

Следует отметить, что случаи «частично зависимых» (или «частично неза-висимых») выборок недопустимы: это непредсказуемым образом нарушает их репрезентативность.

В заключение отметим, что можно выделить две парадигмы психологи-ческого исследования. Так называемая R -методология предполагает изучение изменчивости некоторого свойства (психологического) под влиянием неко-торого воздействия, фактора либо другого свойства. Выборкой является мно- жество испытуемых . Другой подход, Q -методология, предполагает исследо-вание изменчивости субъекта (единичного) под влиянием различных стимулов (условий, ситуаций и т. д.). Ей соответствует ситуация, когда выборкой явля- ется множество стимулов .

Проверка выборки на наличие аномальных значений.

Для проверки нормальности используются различные процедуры, позво-ляющие выяснить, отличается ли от нормального выборочное распределение измеренной переменной. Необходимость такого сопоставления возникает, когда мы сомневаемся в том, в какой шкале представлен признак - в поряд-ковой или метрической. А сомнения такие возникают очень часто, так как заранее нам, как правило, не известно, в какой шкале удастся измерить изу-чаемое свойство (исключая, конечно, случаи явно номинативного измерения).

Важность определения того, в какой шкале измерен признак, трудно пе-реоценить, по крайней мере, по двум причинам. От этого зависит, во-первых, полнота учета исходной эмпирической информации (в частности, об инди-видуальных различиях), во-вторых, доступность многих методов анализа дан-ных. Если исследователь принимает решение об измерении в порядковой шкале, то неизбежное последующее ранжирование ведет к потере части ис-ходной информации о различиях между испытуемыми, изучаемыми группа-ми, о взаимосвязях между признаками и т. д. Кроме того, метрические дан-ные позволяют использовать значительно более широкий набор методов анализа и, как следствие, сделать выводы исследования более глубокими и содержательными.

Наиболее весомым аргументом в пользу того, что признак измерен в мет-рической шкале, является соответствие выборочного распределения нормаль-ному. Это является следствием закона нормального распределения. Если вы- борочное распределение не отличается от нормального, то это значит, что измеряемое свойство удалось отразить в метрической шкале (обычно - интер-вальной).

Существует множество различных способов проверки нормальности, из которых мы кратко опишем лишь некоторые, предполагая, что эти проверки читатель будет производить при помощи компьютерных программ.

Графический способ (Q - Q Plots , Р-Р Plots ). Строят либо квантильные гра-фики, либо графики накопленных частот. Квантильные графики (Q - Q Plots ) строятся следующим образом. Сначала определяются эмпирические значе-ния изучаемого признака, соответствующие 5, 10, ..., 95-процентилю. Затем по таблице нормального распределения для каждого из этих процентилей определяются z-значения (теоретические). Два полученных ряда чисел за-дают координаты точек на графике: эмпирические значения признака откладываются на оси абсцисс, а соответствующие им теоретические значе-ния - на оси ординат. Для нормального распределения все точки будут ле- жать на одной прямой или рядом с ней . Чем больше расстояние от точек до прямой линии, тем меньше распределение соответствует нормальному. Гра-фики накопленных частот (Р-Р Plots ) строятся подобным образом. На оси абсцисс через равные интервалы откладываются значения накопленных от-носительных частот, например 0,05; 0,1; ...; 0,95. Далее определяются эмпи-рические значения изучаемого признака, соответствующие каждому значе-нию накопленной частоты, которые пересчитываются в z-значения. По таблице нормального распределения определяются теоретические накоп- ленные частоты (площадь под кривой) для каждого из вычисленных r-значений, которые откладываются на оси ординат. Если распределение со- ответствует нормальному, полученные на графике точки лежат на одной прямой .

Критерии асимметрии и эксцесса. Эти критерии определяют допустимую степень отклонения эмпирических значений асимметрии и эксцесса от нуле-вых значений, соответствующих нормальному распределению. Допустимая степень отклонения - та, которая позволяет считать, что эти статистики су-щественно не отличаются от нормальных параметров. Величина допустимых отклонений определяется так называемыми стандартными ошибками асим-метрии и эксцесса. Для формулы асимметрии (4.10) стандартная ошибка оп-ределяются по формуле:

где N - объем выборки.

Выборочные значения асимметрии и эксцесса значительно отличаются от нуля, если не превышают значения своих стандартных ошибок. Это можно считать признаком соответствия выборочного распределения нормальному закону. Следует отметить, что компьютерные программы вычисляют показа-тели асимметрии, эксцесса и соответствующие им стандартные ошибки по другим, более сложным формулам.

Статистический критерий нормальности Колмогорова-Смирнова считается наиболее состоятельным для определения степени соответствия эмпиричес-кого распределения нормальному. Он позволяет оценить вероятность того, что данная выборка принадлежит генеральной совокупности с нормальным распределением. Если эта вероятность р< 0,05, то данное эмпирическое распределение существенно отличается от нормального, а если р > 0,05, то делают вывод о приблизительном соответствии данного эмпирического рас-пределения нормальному.

Причины отклонения от нормальности. Общей причиной отклонения фор-мы выборочного распределения признака от нормального вида чаще всего является особенность процедуры измерения: используемая шкала может об-ладать неравномерной чувствительностью к измеряемому свойству в разных частях диапазона его изменчивости.

ПРИМЕР Предположим, выраженность некоторой способности определяется количеством выполненных заданий за отведенное время. Если задания простые или время слиш-ком велико, то данная измерительная процедура будет обладать достаточной чув-ствительностью лишь в отношении части испытуемых, для которых эти задания достаточно трудны. И слишком большая доля испытуемых будет решать все или почти все задания. В итоге мы получим распределение с выраженной правосторон-ней асимметрией. Можно, конечно, впоследствии повысить качество измерения путем эмпирической нормализации, добавив более сложные задания или сократив время выполнения данного набора заданий. Если же мы чрезмерно усложним из-мерительную процедуру, то возникнет обратная ситуация, когда большая часть ис-пытуемых будет решать малое количество заданий и эмпирическое распределение приобретет левостороннюю асимметрию.

Таким образом, такие отклонения от нормального вида, как право- или левосторонняя асимметрия или слишком большой эксцесс (больше 0), связа-ны с относительно низкой чувствительностью измерительной процедуры в области моды (вершины графика распределения частот).

Последствия отклонения от нормальности. Следует отметить, что задача получения эмпирического распределения, строго соответствующего нормаль-ному закону, нечасто встречается в практике исследования. Обычно такие случаи ограничиваются разработкой новой измерительной процедуры или тестовой шкалы, когда применяется эмпирическая или нелинейная норма-лизация для «исправления» эмпирического распределения. В большинстве случаев соответствие или несоответствие нормальности является тем свой- ством измеренного признака, который исследователь должен учитывать при выборе статистических процедур анализа данных.

В общем случае при значительном отклонении эмпирического распреде-ления от нормального следует отказаться от предположения о том, что при-знак измерен в метрической шкале. Но остается открытым вопрос о том, како-ва мера существенности этого отклоне-ния? Кроме того, разные методы ана-лиза данных обладают различной чувствительностью к отклонениям от нормальности. Обычно при обоснова-нии перспективности этой проблемы приводят принцип Р. Фишера, одного из «отцов-основателей» современной статистики: «Отклонения от нормально го вида, если только они не слишком заметны, можно обнаружить лишь для боль- ших выборок; сами по себе они вносят малое отличие в статистические крите рии и другие вопросы». К примеру, при малых, но обычных для психологичес-ких исследований выборках (до 50 человек) критерий Колмогорова-Смирнова недостаточно чувствителен при определении даже весьма заметных «на глаз» отклонений от нормальности. В то же время некоторые процедуры анализа метрических данных вполне допускают отклонения от нормального распре-деления (одни - в большей степени, другие - в меньшей). В дальнейшем при изложении материала мы при необходимости будем оговаривать меру жесткости требования нормальности.

Основные правила стандартизации психодиагностических методик.

091208-matmetody.txt

Тестовые шкалы разрабатываются для того, чтобы оценить индивидуаль-ный результат тестирования путем сопоставления его с тестовыми нормами, полученными на выборке стандартизации. Выборка стандартизации специаль-но формируется для разработки тестовой шкалы - она должна быть репре-зентативна генеральной совокупности, для которой планируется применять данный тест. Впоследствии при тестировании предполагается, что и тестиру-емый, и выборка стандартизации принадлежат одной и той же генеральной совокупности.

Исходным принципом при разработке тестовой шкалы является предпо-ложение о том, что измеряемое свойство распределено в генеральной сово-купности в соответствии с нормальным законом. Соответственно, измерение в тестовой шкале данного свойства на выборке стандартизации также должно обеспечивать нормальное распределение. Если это так, то тестовая шкала является метрической - точнее, равных интервалов. Если это не так, то свой-ство удалось отразить в лучшем случае - в шкале порядка. Естественно, что большинство стандартных тестовых шкал являются метрическими, что по-зволяет более детально интерпретировать результаты тестирования - с уче-том свойств нормального распределения - и корректно применять любые методы статистического анализа. Таким образом, основная проблема стандар- тизации теста заключается в разработке такой шкалы, в которой распределе- ние тестовых показателей на выборке стандартизации соответствовало бы нормальному распределению.

Исходные тестовые оценки - это количество ответов на те или иные воп-росы теста, время или количество решенных задач и т. д. Они еще называют-ся первичными, или «сырыми» оценками. Итогом стандартизации являются тестовые нормы - таблица пересчета «сырых» оценок в стандартные тестовые шкалы.

Существует множество стандартных тестовых шкал, основное назначение которых - представление индивидуальных результатов тестирования в удоб-ном для интерпретации виде. Некоторые из этих шкал представлены на рис. 5.5. Общим для них является соответствие нормальному распределению, а различаются они только двумя показателями: средним значением и мас-штабом (стандартным отклонением - о), определяющим дробность шкалы.

Общая последовательность стандартизации (разработки тестовых норм - таб-лицы пересчета «сырых» оценок в стандартные тестовые) состоит в следующем:

определяется генеральная совокупность, для которой разрабатывается
методика и формируется репрезентативная выборка стандартизации;

по результатам применения первичного варианта теста строится рас-
пределение «сырых» оценок;

проверяют соответствие полученного распределения нормальному за-
кону;

если распределение «сырых» оценок соответствует нормальному, про-
изводится линейная стандартизация;

если распределение «сырых» оценок не соответствует нормальному, то
возможны два варианта:

перед линейной стандартизацией производят эмпирическую норма-
лизацию;

проводят нелинейную нормализацию.

Проверка распределения «сырых» оценок на соответствие нормальному закону производится при помощи специальных критериев, которые мы рас-смотрим далее в этой главе.

Линейная стандартизация заключается в том, что определяются границы интервалов «сырых» оценок, соответствующие стандартным тестовым пока-зателям. Эти границы вычисляются путем прибавления к среднему «сырых» оценок (или вычитания из него) долей стандартных отклонений, соответству-ющих тестовой шкале.

Тестовые нормы - таблица пересчета «сырых» баллов в стены


«Сырые» баллы

Пользуясь этой таблицей тестовых норм индивидуальный результат («сырой» балл) переводят в шкалу стенов, что позволяет интерпретировать выраженность измеря-емого свойства.

Эмпирическая нормализация применяется, когда распределение «сырых» баллов отличается от нормального. Она заключается в изменении содер-жания тестовых заданий. Например, если «сырая» оценка - это количе-ство задач, решенных испытуемыми за отведенное время, и получено рас-пределение с правосторонней асимметрией, то это значит, что слишком большая доля испытуемых решает больше половины заданий. В этом случае необходимо либо добавить более трудные задания, либо сократить время решения.

Нелинейная нормализация применяется, если эмпирическая нормализа-ция невозможна или нежелательна, например, с точки зрения затрат вре-мени и ресурсов. В этом случае перевод «сырых» оценок в стандартные про-изводится через нахождение процентильных границ групп в исходном распределении, соответствующих процентильным границам групп в нор-мальном распределении стандартной шкалы. Каждому интервалу стандарт-ной шкалы ставится в соответствие такой интервал шкалы «сырых» оценок, который содержит ту же процентную долю выборки стандартизации. Вели-чины долей определяются по площади под единичной нормальной кривой, заключенной между соответствующими данному интервалу стандартной шкалы г-оценками.

Например, для того чтобы определить, какой «сырой» балл должен соот-ветствовать нижней границе стена 10, необходимо сначала выяснить, какому г-значению соответствует эта граница (z = 2). Затем по таблице нормального распределения (приложение 1) надо определить, какая доля площади под нормальной кривой находится правее этого значения (0,023). После этого определяется, какое значение отсекает 2,3% наибольших значений «сырых» баллов выборки стандартизации. Найденное значение и будет соответство-вать границе 9 и 10 стена.

Изложенные основы психодиагностики позволяют сформулировать мате-матически обоснованные требования к тесту. Тестовая методика должна со- держать:

описание выборки стандартизации;

характеристику распределения «сырых» баллов с указанием среднего и
стандартного отклонения;

наименование, характеристику стандартной шкалы;

тестовые нормы - таблицы пересчета «сырых» баллов в шкальные.

Шкала Z-оценок. (???)

091208-matmetody.txt

Стандартизированное (или стандартное) отклонение принято обозначать буквой Z. (рис. 1 в тетради) Получаются Z-оценки.

Особое место среди норнмальных распределений занимает так называемое стандартное или единичное нормальное распределение. Такое распределение получается при условии, что среднее арифметическое равно нулю, стандартное отклонение равно 1. Нормальное распределение удобно тем, что путём стандартизации к нему может быть сведено любое распределение.

Операция стандартизации заключается в следующем: от каждого индивидуального значения параметра вычитается среднее арифметическое значение. Эта операция называется центрированием. А полученная разность делится на значение стандартного отклонения. Эта операция называется нормированием.

с. 47 (54) (см. там рисунок со шкалами)

monitoring2.htm

Таким образом, если мы отнимем от среднего значения результат конкретного испытуемого и разделим разницу на стандартное отклонение, то мы сможем выразить индивидуальный показатель как долю от стандартного отклонения. Полученные таким образом доли в диагностике называют Z-оценками. Z – оценка это основа любой стандартной шкалы. Самое привлекательное свойство z-оценок заключается в том, что они характеризуют относительное положение результата обследуемого среди всех результатов группы независимо от среднего и стандартного отклонения. Кроме того, z – оценки свободны от единицы измерения. Благодаря этим двум свойствам z – оценок с их помощью могут сопоставляться результаты, полученные самыми различными путями и по самым различным аспектам выборки поведения.

Шкала станайнов
Шкала стенов
Т-шкала
Шкала IQ

Шкалы, производные от шкалы Z-оценок.

monitoring2.htm (там же хорошее начало про стандартизацию и стандартное отклонение)

Недостатком z-шкалы является то, что приходится иметь дело с дробными и отрицательными величинами . Поэтому ее, обычно преобразовывают в так называемые стандартные шкалы, которые более удобны в работе. Традиционно и чаще других в диагностике используются такие шкалы как:

Шкала станайнов
Шкала стенов
Т-шкала
Шкала IQ

с. 47 (54) (см. там рисунок со шкалами)

0028.htm 7. Стандартизация психологического опросника

Нормализация показателей тестирования.

Для того, чтобы психологическим опросником можно было пользоваться практически, т.е. делать на основании его заполнения произвольно взятым испытуемым прогноз его поведения в новых ситуациях (используя критерии валидности данного опросника), необходима нормализация показателей на нормативной выборке. Лишь использование статистических нормативов дает возможность судить о повышении или понижении выраженности того или иного психологического качества у конкретного испытуемого. Хотя нормы важны для прикладной психологии, для психологических исследований проще всего использовать непосредственно сырые показатели.

Показатели конкретного испытуемого должны сравниваться с показателями адекватной нормативной группы. Это осуществляется посредством некоторого преобразования, которое выявляет статус этого индивида относительно данной группы.

Линейные и нелинейные преобразования сырых значений шкалы. Стандартные показатели могут быть получены как линейным, так и нелинейным преобразованием первичных показателей. Линейные преобразования получаются вычитанием из первичного показателя константы и дальнейшего деления на другую константу, поэтому все соотношения, характерные для первичных показателей, также имеют место и для линейных. Наиболее часто используется z–оценка (Формула 3).

Но в силу того, что часто распределение итоговых баллов по той или иной шкале не является нормальным, из этих стандартизованных показателей нельзя вывести процентилей, т.е. оценить, как много процентов испытуемых получили такой же показатель, что и данный испытуемый.

Если процентильная нормализация с переводом в стены и линейная нормализация с переводом в стены дают совпадающие значения стенов, то распределение считается нормальным с точностью до стандартной десятки.

Чтобы добиться сопоставимости результатов, принадлежащих к распределениям различной формы, может быть применено нелинейное преобразование.

Нормализованные стандартные показатели, полученные с помощью нелинейного преобразования, – это стандартные показатели, соответствующие распределению, преобразованному так, что оно принимает вид нормального. Для их расчета создаются специальные таблицы перевода сырых баллов в стандартные. В них приводится процент случаев различных степеней отклонений (в единицах σ от среднего значения). Так, среднее значение, которое соответствует достижению 50% результатов группы, может приравниваться к 0. Среднее значение минус стандартное отклонение может быть приравнено к -1, это новое значение будет наблюдаться примерно у 16% выборки, а значение +1 – примерно у 84%.

работе Работа логопедических групп»; 2.«Соблюдение... санитарных норм в школьных столовых»; 3.«О работе администрации Воеводской специальной (коррекционной) школы...

План работы (21)

Вопросы к экзамену

План работы Вопросы к экзамену 1 21. Виды... и отсылаем к предыдущему критерию. Дальнейшая работа с критерием Пейджа заключается в преобразовании таблицы... следственная связь обоснована в теоретической части работы и подтверждается многими авторами, то...