Среднее квадратическое отклонение. Коэффициент вариации и коэффициент детерминации

ВВЕДЕНИЕ

Методические указания по выполнению практических и лабораторных работ по статистике содержат требования по их выполнению, порядок расчетов вручную и с использованием MS Excel, ППП Statistica.

Часть II методических указаний характеризует расчет показателей вариации: размаха вариации, квартилей и квартильного отклонения, среднего линейного отклонения, дисперсии и среднего квадратического отклонения, коэффициентов осцилляции, вариации, асимметрии, эксцесса и других.

Расчет показателей вариации наряду с построением интервальных и дискретных вариационных рядов и расчетом средних величин, представленными в части I методических указаний, имеет большое значение для анализа рядов распределения.

РАСЧЕТ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ

Цель работы: получение практических навыков в расчете различных показателей (меры) вариации в зависимости от поставленных исследованием задач.

Порядок выполнения работы:

Определить вид и форму (простая или взвешенная) показателей вариации.

Сформулировать выводы.

Пример расчета показателей вариации

Определение вида и формы показателей вариации.

Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным относятся: размах вариации, квартильное отклонение, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Относительными показателями являются коэффициенты осцилляции, вариации, относительное линейное отклонение и т. д.

Размах вариации (R) является наиболее простым измерителем вариации признака и определяется по следующей формуле:

где - наибольшее значение варьирующего признака;

Наименьшее значение варьирующего признака.

Квартильное отклонение (Q) - применяется для характеристики вариации признака в совокупности. Может использоваться вместо размаха вариации во избежание недостатков, связанных с использованием крайних значений.

Квартили - это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине; 25% единиц будут заключены между и; 25% единиц будут заключены между и, и остальные 25% превосходят.

где - нижняя граница интервала, в котором находится первая квартиль;

Сумма накопленных частот интервалов, предшествующих интервалу, в котором находится первая квартиль;

Частота интервала, в котором находится первая квартиль.

где Ме - медиана ряда;

условные обозначения те же, что и для величины.

В симметричных или умеренно асимметричных распределениях Q2/3. Так как на квартильное отклонение не влияют отклонения всех значений признака, то его использование следует ограничить случаями, когда определение среднего квадратического отклонения затруднительно или невозможно.

Среднее линейное отклонение () представляет собой среднюю величину из абсолютных отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения.

(6) - невзвешенное среднее линейное отклонение,

(7) - взвешенное среднее линейное отклонение.

Дисперсия () - средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия вычисляется по формулам простой невзвешенной и взвешенной.

(8) - невзвешенная,

(9) - взвешенная.

Среднее квадратическое отклонение () - наиболее распространенный показатель вариации, представляет собой квадратный корень из значения дисперсии.

Размах вариации, квартильное отклонение, среднее линейное и квадратическое отклонения - величины именованные, имеют размерность осредняемого признака.

Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Чаще всего относительные показатели выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности.

Коэффициент осцилляции рассчитывается по формуле:

Относительное линейное отклонение (линейный коэффициент вариации):

(13) или (14)

Коэффициент вариации:

Наиболее часто применяемый в статистике показатель относительной колеблемости - коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и как характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (Ефимова М.Р., Рябцев В.М. Общая теория статистики: Учебник М.: Финансы и статистика, 1991 г., стр. 105).

Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму).

В практике статистического исследования приходится встречаться с самыми различными распределениями. При изучении однородных совокупностей имеем дело, как правило, с одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности, появление двух и более вершин говорит о необходимости перегруппировки данных с целью выделения более однородных групп. Выяснение общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса. Симметричным является распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. Для симметричных распределений средняя арифметическая, мода и медиана равны между собой. В связи с этим простейший показатель асимметрии основан на соотношении показателей центра распределения: чем больше разница между средними, тем больше асимметрия ряда.

Для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель As:

Величина показателя As может быть положительной и отрицательной. Положительная величина показателя указывает на наличие правосторонней асимметрии (правая ветвь относительно максимальной ординаты вытянута больше, чем левая). При правосторонней асимметрии между показателями центра распределения существует соотношение: . Отрицательный знак показателя асимметрии свидетельствует о наличии левосторонней асимметрии (Рисунок 1). Между показателями центра распределения в этом случае имеется такое соотношение: .

Рисунок 1. Распределение: 1 - с правосторонней асимметрией; 2 - с левосторонней асимметрией.

Другой показатель, предложенный шведским математиком Линдбергом, рассчитывают по формуле:

где П - процент тех значений признака, которые превосходят по величине среднюю арифметическую.

Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка (в симметричном распределении его величина равна нулю):

где - центральный момент третьего порядка:

(19) - для несгруппированных данных;

(20) - для сгруппированных данных.

у - среднеквадратическое отклонение.

Применение этого показателя дает возможность не только определить величину асимметрии, но и ответить на вопрос о наличии или отсутствии асимметрии в распределении признака в генеральной совокупности. Оценка степени существенности этого показателя дается с помощью средней квадратической ошибки, которая зависит от объема наблюдений n и рассчитывается по формуле:

Если отношение, асимметрия существенна, и распределение признака в генеральной совокупности не является симметричным. Если отношение, асимметрия несущественна, ее наличие может быть объяснено влиянием различных случайных обстоятельств.

Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Линдбергом предложен следующий показатель для оценки эксцесса:

где П - доля (%) количества вариантов, лежащих в интервале, равном половине среднего квадратического отклонения в ту или другую сторону от средней арифметической.

Наиболее точным является показатель, использующий центральный момент четвертого порядка:

где - центральный момент четвертого момента;

(24) - для несгруппированных данных;

(25) - для сгруппированных данных.

На рисунке 2 представлены два распределения: одно - островершинное (величина эксцесса положительная), второе - плосковершинное (величина эксцесса отрицательная). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении отношение.

Рисунок 2. Распределение: 1,4 - нормальное; 2 - островершинное; 3 - плосковершинное

Средняя квадратическая ошибка эксцесса рассчитывается по формуле:

где n - число наблюдений.

Если, то эксцесс существенен, если, то несущественен.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпирическое исследование к типу кривых нормального распределения.

Рассмотрим методику исчисления показателей вариации.

Таблица 1. Данные об объеме продаж валюты нескольких отделений Центробанка.

Определить средний объем продаж валюты по совокупности отделений, рассчитать абсолютные и относительные показатели вариации.

Рассчитаем размах вариации:

R = = 24,3 - 10,2 = 14,1 млн. руб.

вариация дисперсия осцилляция вариация асимметрия эксцесс

Для определения отклонений значений признака от средней и их квадратов строим вспомогательную таблицу:

Таблица 2. Расчетная таблица

Среднее значение находим по формуле средней арифметической простой:

Среднее линейное отклонение:

Дисперсия:

Коэффициент осцилляции:

Коэффициент вариации:

Для расчета показателей формы распределения строим вспомогательную таблицу:

Таблица 3. Расчетная таблица


Таблица 4. Данные о товарообороте предприятий одной из отраслей промышленности.

Определить средний объем товарооборота, структурные средние, абсолютные и относительные показатели вариации и насколько фактическое распределение согласуется с нормальным (по показателям формы распределения).

Для расчета показателей построим вспомогательную таблицу.

Таблица 5. Расчетная таблица

Размах вариации:

Среднее значение находим по формуле средней арифметической взвешенной:

В интервальных рядах распределения мода определяется по формуле:

В нашем случае мода будет равна:

В интервальном вариационном ряду медиана определяется по формуле:

В нашем случае медиана будет равна:

Квартильное отклонение:

где и - соответственно первая и третья квартили распределения.

Квартили определяются по формулам:

Среднее линейное отклонение:

Дисперсия:

Среднее квадратическое отклонение:

Рассчитаем относительные показатели вариации.

Коэффициент осцилляции:

Относительное линейное отклонение:

Относительный показатель квартильной вариации:

Коэффициент вариации:

Определим показатели формы распределения:

Формулировка выводов.

Сформулируем выводы по рассчитанным показателям вариации примера 2, в котором представлен интервальный ряд распределения предприятий по объему товарооборота, млн. руб.

Размах вариации свидетельствует о том, что разница между максимальным и минимальным значением составляет 40 млн. руб. Средний объем товарооборота - 30 млн. руб. Чаще всего встречающееся значение объема товарооборота в рассматриваемой совокупности предприятий - 31,4 млн. руб., причем 50% (40 предприятий) имеют объем товарооборота менее 30,5 млн. руб., а 50% свыше.

Квартильное отклонение, равное 5, свидетельствует об умеренной асимметрии распределения, так как в симметричных или умеренно асимметричных распределениях (в рассматриваемом примере).

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности. Так, средняя величина колеблемости объема товарооборота предприятий отраслей промышленности составляет: по среднему линейному отклонению - 6,5 млн. руб. (абсолютное отклонение); по среднему квадратическому отклонению - 8,1 млн. руб. Квадрат отклонений индивидуальных значений признака от их средней величины равен 65.

Разница между крайними значениями признака на 33,3% превышает среднее значение (= 133,3%).

Относительное линейное отклонение (= 21,7%) и относительный показатель квартильной вариации (= 16,4%) характеризуют однородность исследуемой совокупности, что подтверждает рассчитанный коэффициент вариации, равный 27% (V =27% меньше 33%).

По рассчитанным показателям асимметрии и эксцесса можно сделать вывод, что распределение плосковершинно (Ex < 0) и наблюдается левосторонняя асимметрия (As < 0). Асимметрия и эксцесс являются несущественными.

Часто в статистике при анализе какого-либо явления или процесса необходимо учитывать не только информацию о средних уровнях исследуемых показателей, но и разброс или вариацию значений отдельных единиц , которая является важной характеристикой изучаемой совокупности.

В наибольшей степени вариации подвержены курсы акций, объемы спроса и предложения, процентные ставки в разные периоды времени и в разных местах.

Основными показателями, характеризующими вариацию , являются размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Размах вариации представляет собой разность максимального и минимального значений признака: R = Xmax – Xmin . Недостатком данного показателя является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.

Дисперсия лишена этого недостатка. Она рассчитывается как средний квадрат отклонений значений признака от их средней величины:

Упрощенный способ расчета дисперсии осуществляется с помощью следующих формул (простой и взвешенной):

Примеры применения данных формул представлены в задачах 1 и 2.

Широко распространенным на практике показателем является среднее квадратическое отклонение :

Среднее квадратическое отклонение определяется как квадратный корень из дисперсии и имеет ту же размеренность, что и изучаемый признак.

Рассмотренные показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемого признака. В отличие от них, коэффициент вариации измеряет колеблемость в относительном выражении - относительно среднего уровня, что во многих случаях является предпочтительнее.

Формула для расчета коэффициента вариации.

Примеры решения задач по теме «Показатели вариации в статистике»

Задача 1 . При изучении влияния рекламы на размер среднемесячного вклада в банках района обследовано 2 банка. Получены следующие результаты:

Определить:
1) для каждого банка: а) средний размер вклада за месяц; б) дисперсию вклада;
2) средний размер вклада за месяц для двух банков вместе;
3) Дисперсию вклада для 2-х банков, зависящую от рекламы;
4) Дисперсию вклада для 2-х банков, зависящую от всех факторов, кроме рекламы;
5) Общую дисперсию используя правило сложения;
6) Коэффициент детерминации;
7) Корреляционное отношение.

Решение

1) Составим расчетную таблицу для банка с рекламой . Для определения среднего размера вклада за месяц найдем середины интервалов. При этом величина открытого интервала (первого) условно приравнивается к величине интервала, примыкающего к нему (второго).

Средний размер вклада найдем по формуле средней арифметической взвешенной:

29 000/50 = 580 руб.

Дисперсию вклада найдем по формуле:

23 400/50 = 468

Аналогичные действия произведем для банка без рекламы :

2) Найдем средний размер вклада для двух банков вместе. Хср =(580×50+542,8×50)/100 = 561,4 руб.

3) Дисперсию вклада, для двух банков, зависящую от рекламы найдем по формуле: σ 2 =pq (формула дисперсии альтернативного признака). Здесь р=0,5 – доля факторов, зависящих от рекламы; q=1-0,5, тогда σ 2 =0,5*0,5=0,25.

4) Поскольку доля остальных факторов равна 0,5, то дисперсия вклада для двух банков, зависящая от всех факторов кроме рекламы тоже 0,25.

5) Определим общую дисперсию, используя правило сложения.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 факт + σ 2 ост = 552,08+345,96 = 898,04

6) Коэффициент детерминации η 2 = σ 2 факт / σ 2 = 345,96/898,04 = 0,39 = 39% - размер вклада на 39% зависит от рекламы.

7) Эмпирическое корреляционное отношение η = √η 2 = √0,39 = 0,62 – связь достаточно тесная.

Задача 2 . Имеется группировка предприятий по величине товарной продукции:

Определить: 1) дисперсию величины товарной продукции; 2) среднее квадратическое отклонение; 3) коэффициент вариации.

Решение

1) По условию представлен интервальный ряд распределения. Его необходимо выразить дискретно, то есть найти середину интервала (х"). В группах закрытых интервалов середину найдем по простой средней арифметической. В группах с верхней границей - как разность между этой верхней границей и половиной размера следующего за ним интервала (200-(400-200):2=100).

В группах с нижней границей – суммой этой нижней границы и половины размера предыдущего интервала (800+(800-600):2=900).

Расчет средней величины товарной продукции делаем по формуле:

Хср = k×((Σ((х"-a):k)×f):Σf)+a. Здесь а=500 - размер варианта при наибольшей частоте, k=600-400=200 - размер интервала при наибольшей частоте. Результат поместим в таблицу:

Итак, средняя величина товарной продукции за изучаемый период в целом равна Хср = (-5:37)×200+500=472,97 тыс. руб.

2) Дисперсию найдем по следующей формуле:

σ 2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05

3) среднее квадратическое отклонение: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 тыс. руб.

4) коэффициент вариации: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52%

Полученные из опыта величины неизбежно содержат погрешности, обусловленные самыми разнообразными причинами. Среди них следует различать погрешности систематические и случайные. Систематические ошибки обусловливаются причинами, действующими вполне определенным образом, и могут быть всегда устранены или достаточно точно учтены. Случайные ошибки вызываются весьма большим числом отдельных причин, не поддающихся точному учету и действующих в каждом отдельном измерении различным образом. Эти ошибки невозможно совершенно исключить; учесть же их можно только в среднем, для чего необходимо знать законы, которым подчиняются случайные ошибки.

Будем обозначать измеряемую величину через А, а случайную ошибку при измерении х. Так как ошибка х может принимать любые значения, то она является непрерывной случайной величиной, которая вполне характеризуется своим законом распределения.

Наиболее простым и достаточно точно отображающим действительность (в подавляющем большинстве случаев) является так называемый нормальный закон распределения ошибок :

Этот закон распределения может быть получен из различных теоретических предпосылок, в частности, из требования, чтобы наиболее вероятным значением неизвестной величины, для которой непосредственным измерением получен ряд значений с одинаковой степенью точности, являлось среднее арифметическое этих значений. Величина 2 называется дисперсией данного нормального закона.

Среднее арифметическое

Определение дисперсии по опытным данным. Если для какой-либо величины А непосредственным измерением получено n значений a i с одинаковой степенью точности и если ошибки величины А подчинены нормальному закону распределения, то наиболее вероятным значением А будет среднее арифметическое :

a - среднее арифметическое,

a i - измеренное значение на i-м шаге.

Отклонение наблюдаемого значения (для каждого наблюдения) a i величины А от среднего арифметического : a i - a.

Для определения дисперсии нормального закона распределения ошибок в этом случае пользуются формулой:

2 - дисперсия,
a - среднее арифметическое,
n - число измерений параметра,

Среднеквадратическое отклонение

Среднеквадратическое отклонение показывает абсолютное отклонение измеренных значений от среднеарифметического . В соответствии с формулой для меры точности линейной комбинации средняя квадратическая ошибка среднего арифметического определяется по формуле:

, где


a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.

Коэффициент вариации

Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического :

, где

V - коэффициент вариации,
- среднеквадратическое отклонение,
a - среднее арифметическое.

Чем больше значение коэффициента вариации , тем относительно больший разброс и меньшая выравненность исследуемых значений. Если коэффициент вариации меньше 10%, то изменчивость вариационного ряда принято считать незначительной, от 10% до 20% относится к средней, больше 20% и меньше 33% к значительной и если коэффициент вариации превышает 33%, то это говорит о неоднородности информации и необходимости исключения самых больших и самых маленьких значений.

Среднее линейное отклонение

Один из показателей размаха и интенсивности вариации - среднее линейное отклонение (средний модуль отклонения) от среднего арифметического. Среднее линейное отклонение рассчитывается по формуле:

, где

_
a - среднее линейное отклонение,
a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.

Для проверки соответствия исследуемых значений закону нормального распределения применяют отношение показателя асимметрии к его ошибке и отношение показателя эксцесса к его ошибке.

Показатель асимметрии

Показатель асимметрии (A) и его ошибка (m a) рассчитывается по следующим формулам:

, где

А - показатель асимметрии,
- среднеквадратическое отклонение,
a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.

Показатель эксцесса

Показатель эксцесса (E) и его ошибка (m e) рассчитывается по следующим формулам:

, где

Многие сталкиваются с изменчивостью изучаемого признака у отдельных единиц совокупности, его колебанием относительно некоторого значения, то есть с его вариацией. Вот ее-то и следует обязательно учитывать, чтобы получить наиболее достоверные сведения о ходе выполнения того или иного научного исследования.

Большинство исследователей, производя определение интервала изменения значения того или иного параметра, чаще всего прибегают к абсолютным и Среди последних наибольшее распространение получил коэффициент вариации, который в случае, если исследуемая величина характеризуется нормальным распределением, является критерием однородности совокупности. Данный показатель позволяет определить, какую степень разбросанности будут иметь значения исследуемого параметра, не обращая внимания на масштаб и единицу измерения.

Коэффициент вариации можно вычислить, разделив на среднее арифметическое значение переменной, выраженное в процентах. Результат данного вычисления может попадать в интервал от нуля до бесконечности, возрастая по мере увеличения вариации признака. Если полученное значение менее 33,3% - вариация признака слабая. Если больше - сильная. В последнем случае исследуемая совокупность данных является неоднородной, ее признается нетипичной, а потому не может быть обобщающим показателем. Поэтому для данной совокупности стоит применить другие показатели.

Стоит отметить, что коэффициент вариации не только характеризует однородность некоторой совокупности, но также применяется в качестве сравнительной ее оценки. Например, его применяют, если необходимо колебания того или иного признака в совокупностях, для которых рассчитанная величина среднего значения различна. В этом случае разброс полученных данных не позволяет произвести объективную оценку обретенного значения. Коэффициент вариации характеризует относительную изменчивость переменной, а потому может являться относительной мерой колебания значения изучаемого параметра.

Однако здесь существуют некоторые ограничения. В частности, оценить степень колебания значений параметра можно лишь для конкретного признака и если совокупность имеет определенный состав. При этом равенство данных показателей может свидетельствовать как о сильной, так и о слабой вариации. Это в случае, если признаки различны или исследования проводятся на разных совокупностях. Такой результат формируется под действием весьма объективных причин, и это следует обязательно учитывать во время обработки полученных экспериментальных данных.

Коэффициент вариации находит широкое применение при проведении в различных отраслях науки и техники. В том числе, его активно задействуют при выполнении оценки колебания параметров в экономике и социологии. При этом применение коэффициента делается невозможным в случае, если необходимо дать оценку изменчивости переменных, которые способны менять свой знак на противоположный. Ведь тогда в результате расчетов будут получены некорректные значения данного показателя: либо оно будет очень маленьким, либо будет иметь отрицательный знак. В последнем случае стоит проверить правильности выполненных расчетов.

Таким образом, можно сказать, что коэффициент вариации - это параметр, который позволит вам оценить степень разброса и относительную изменчивость средней величины. Применение данного показателя позволяет выявить наиболее значимые факторы, акцентирование внимания на которых позволит достичь поставленных целей и решить необходимые задачи.

Любая статистическая совокупность состоит из единиц, значения признака которых варьируют. Для того, чтобы судить об однородности совокупности и типичности средней величины изучаемого признака, анализ следует дополнять исчислением показателей вариации.

Вариация - это колеблемость, многообразие, изменяемость величины признака у отдельных единиц совокупности.

К абсолютным показателям вариации относят: размах вариации, среднее линейное отклонение, дисперсию и среднее квадратическое отклонение.

Размах вариации - характеристика границ вариации изучаемого признака. Показывает, сколь велико различие между единицами совокупности, имеющими самое маленькое и самое большое значение признака, основан на крайних значениях варьирующего признака и не отражает отклонений всех вариант в ряду. Определяется по формуле:

R=Xmax-Xmin, (5.4)

где Xmax - максимальное значение вариационного ряда;

Xmin - минимальное.

Среднее линейное отклонение показывает, на какую величину отклоняется признак в изучаемой совокупности от средней величины признака. Находится по формуле:

где - индивидуальные значения варьирующего признака (варианты); - частоты, веса; - среднее значение варьирующего признака;

Дисперсия - средний квадрат отклонения индивидуальных значений признака от их средней величины. Вычисляется по следующим формулам.

Первый способ определения дисперсии:

Второй способ определения дисперсии (по средней арифметической):

где - средняя из квадратов индивидуальных значений; - квадрат средней величины признака.

Среднее квадратическое отклонение - это обобщающая характеристика размеров вариации признака в совокупности. Показывает, на какую величину в среднем значение признака отличается от стандартного значения, определяется по формуле:

Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее (количественно) совокупность и тем более типичной будет средняя величина.

Рассчитаем показатели вариации для группировки транспортных организаций по грузообороту автомобильного транспорта (таблица 5.1).

Найдем размах вариации (по формуле 5.4):

Разброс значений грузооборота транспорта общественного пользования достаточно высок.

Вычислим среднее линейное отклонение (по формуле 5.5):


Значения грузооборота автомобильного транспорта отличались от среднего значения на 508,8 млн. т. км.

Рассчитаем дисперсию двумя способами (по формулам 5.6 - 5.7). Первый способ:



Вычислим среднее квадратическое отклонение (по формуле 5.8):

Это значит, что грузооборот транспорта общественного пользования в среднем отличается от стандартного значения на 23,68 млн. т. км.

Найдем показатели вариации для группировки площадей жилых помещений (таблица 5.3), используя формулы 5.4 - 5.8

Вычислим размах вариации:

Размах вариации в 3,1 м2 показывает нам, что разброс значений площадей жилых помещений не очень высок.

Рассчитаем среднее линейное отклонение:

Таким образом, значения площадей жилых помещений в изучаемой совокупности отклоняются от средней величины на 1,19 м2.

Рассчитаем дисперсию двумя способами.

Первый способ:


Второй способ (по средней арифметической):

Вычислим среднее квадратическое отклонение:

Оно показывает, что значения площадей жилых помещений в среднем отличается от стандартного значения на 1,3 м2 .

Коэффициенты вариации

Вариация измеряется с помощью относительных величин, называемых коэффициентами вариации и определяемых в виде отношения среднего отклонения к средней величине. Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Значения коэффициента вариации изменяются от 0 до 100% и чем ближе он к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности, а значит и качественнее подобраны статистические данные. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Различают следующие относительные показатели вариации:

Коэффициент вариации:

где - среднее квадратическое отклонение, - средняя арифметическая.

Линейный коэффициент вариации:

где - среднее линейное отклонение.

Коэффициент осцилляции:

где - размах вариации.

Вычислим коэффициенты вариации для группы организаций по грузообороту автомобильного транспорта (таблица 5.1) по формулам 5.9, 5.10, 5.11

Коэффициент вариации будет равен: , что превышает 33%, следовательно, совокупность неоднородна.

Вычислим линейный коэффициент вариации: . Следовательно, доля усредненного значения абсолютных отклонений организаций от средней величины равна 30,7%

Найдем коэффициент осцилляции: . Из этого следует, что разница между максимальным и минимальным значениями организаций превышает среднее значение почти в 1,078 раз.

Определим коэффициенты вариации для группировки площадей жилых помещений (в среднем на одного жителя) (таблица 5.3).

Вычислим коэффициент вариации по формуле (5.9):

Это значит что коэффициент вариации не превышает 33%, следовательно, совокупность однородна.

Рассчитаем линейный коэффициент вариации по формуле (5.10):

Это значит, что доля усредненного значения абсолютных отклонений площадей жилых помещений от средней величины равна 5,56%.

Найдем коэффициент осцилляции по формуле (5.11):

Разница между максимальным и минимальным значениями площадей жилых помещений не превышает среднее значение.



Доверенности