Коэффициент вариации зачем нужен. Расчет коэффициента вариации в Microsoft Excel. Эмпирический коэффициент детерминации

Показатели вариации

Понятие вариации

Вариация - это наличие различий у отдельных единиц сово­купности по какому-либо признаку.

Эта категория занимает особое место в статистической науке, ибо именно наличие вариации единиц совокупности предопределяет необходимость статистики. Если бы отдельные единицы сово­купности имели они и те же значения признаков (например, рост, возраст у всех живущих людей был бы одинаковый), то для изу­чения данной совокупности по этим признакам достаточно было бы изучить только одну единицу совокупности. Однако зачастую значения признаков колеблются, изменяются при переходе от од­ной единицы к другой. Как правило, вариация является порожде­нием следующих причин:

Своеобразие условий, в которых происходит развитие от­дельных единиц совокупности;

Неравномерность развития отдельных единиц.

Например, причиной вариации роста у отдельно взятых людей является генетическая особен­ность каждого организма (основная причина), особенности питания, экологическая обстановка и т.д.; вариация урожайности может быть вызвана климатическими, почвенными особенностями зоны про­израстания, режима и возможности полива, качеством посадочного материала и т.д.

Вариация существует во времени и в пространстве.

Под вариаци­ей в пространстве понимается колеблемость значений признака по отдельным территориям (урожайность пшеницы в разных ре­гионах).

Под вариацией во времени подразумевается объективное измене­ние значений признака в разные периоды (или моменты). Напри­мер, со временем изменяется средняя продолжительность пред­стоящей жизни, доходность предприятий отрасли, уровень по­требностей людей и т.д.

Изучение вариации имеет важное значение, так как вариация ха­рактеризует степень однородности совокупности. Однородность совокупности - необходимое условие при расчете большинства статистических показателей, в частности средних величин.

Показатели вариации

Показатели вариации являются необходимым дополнением при расчете средних величин, так как определяют степень однород­ности совокупности.

Система показателей вариации включает следующее:

Размах вариации;

Среднее квадратическое отклонение;

Дисперсия;

Коэффициент вариации.

Значение показателей вариации:

Характеризуются размеры вариации признака;

Показатели вариации дополняют систему средних величин, в которой затушевываются индивидуальные различия;

Показатели вариации позволяют охарактеризовать уровень однородности совокупности;

С помощью показателей вариации, путем сравнения вариа­ции у отдельных признаков (разных), есть возможность измерить взаимосвязь между этими признаками.

Первый показатель, так называемый размах вариации, - наи­более простой из показателей, характеризует абсолютные разме­ры изменения признака и определяется как разница максимально­го и минимального значений признака:

Несмотря на простоту расчета, этот показатель имеет важный не­достаток - учитывает только два приграничных значения. В случае аномальности одного или двух приграничных значений, он может исказить действительную вариацию совокупности.

Для того чтобы избавиться от этого недостатка, рассчитывают отклонение каждой индивидуальной величины от средней по со­вокупности. Таким образом, учитывается значение каждой еди­ницы совокупности. Для того чтобы охарактеризовать это откло­нение одним числом, рассчитывают среднюю из этих значений. Данный показатель носит название среднее абсолютное (линей­ное) отклонение и определяется следующим образом:

Простой вид;

- взвешенный вид (для сгруппированных данных);

где d(L) - среднее абсолютное (линейное) отклонение;

х - индивидуальное значение признака (варианта);

Среднее из значений признака;

п - численность совокупности;

f - частота.

Среднее линейное отклонение характеризует средний размер отклонений индивидуальных значений признака от средней вели­чины. Таким образом, он характеризует абсолютные размеры ва­риации, имеет те же единицы измерения, что и признак, вариа­цию которого характеризует.

Недостаток: ввиду того, что применяется модуль, затруднено проведение математических операций. Поэтому он применяется редко.

Для того чтобы избавиться от недостатка предыдущего показате­ля, разницу между индивидуальным значением и средней возве­дем в квадрат и затем извлечем корень квадратный из полученно­го среднего значения. Полученный показатель будет называться среднее квадратическое отклонение:

- простая.

- взвешенная.

Играет ту же роль, что и среднее абсолютное отклонение, но, имеет перед ним одно преимущество, а именно, с ним проще проводить математические операции. Ввиду этого в 90 случаях из 100 используется этот показатель.

Еще более удобный для математических преобразований показа­тель вариации - дисперсия, который представляет собой сред­нее квадратическое отклонение в квадрате:

- простая,

- взвешенная.

С помощью дисперсии и среднего квадратического отклонения измеряются взаимосвязи между различными признаками. Кроме того, по этим показателям можно сравнивать совокупности в смысле их однородности по одинаковым признакам.

Вывод об однородности совокупности позволяет сделать коэффициент вариации , который может быть рассчитан несколькими способами в зависимости от исходной информации:

Характеризует средний процент отклонений индивидуальных значений признака от средней величины.

,

,

,

где V – коэффициент вариации;

σ – среднее квадратическое отклонение;

d (L) – среднее линейное отклонение;

Х МО – мода (структурная средняя);

Х МЕ – медиана(структурная средняя).

Коэффициент вариации имеет большое значение. Он позволяет сравнивать уровень вариации по различным признакам и используется для характеристики однородности совокупности. Если коэффициент вариации меньше 33%, то совокупность однородна.

Пример расчета показателей вариации.

Распределение студентов вуза по возрасту характеризуются следующими данными (табл. 1):

Таблица 1

Рассчитайте показатели, характеризующие вариацию возраста студентов для каждой формы



обучения. Сравните полученные результаты.

Рассчитаем показатели вариации, характеризующие совокупность студентов очно-заочной формы

обучения.

1. Размах вариации:

R = x max – x min = 31 - 18,5 = 12,5 (лет)

2. Средняя арифметическая:

3. Среднее линейное отклонение:

Возраст отдельно взятого студента отклоняется от среднего по совокупности возраста - 27 лет - на 3 года. То есть можно утверждать, что возраст наибольшего числа студентов не будет выходить за границы интервала: от 24,3 до 30,4 лет.

27,36 - 3,07 < 27,36 < 27,36+ 3,07.

Среднее квадратическое отклонение:

Среднее квадратическое отклонение также характеризует абсолютную величину отклонения индиви­дуального значения от средней. Как правило, значение среднего квадратического отклонения больше среднего линейного отклонения.

Дисперсия:

=13,899

Характеризует квадрат отклонений индивидуального значения от средней величины. Коэффициент вариации:

Средний процент отклонений индивидуальных значений от средней величины составляет 13,6%. Со­вокупность однородна. Сделаем аналогичные расчеты по совокупности студентов дневного отделения. Получаем следующие результаты:

d(L) = 3,40

V = 21,9%

На основании приведенных расчетов можно сделать вывод о том, что совокупность студентов очно-заочного отделения более однородная.

Расчет показателей вариации - достаточно трудоемкий процесс. В некоторых случаях, когда имеется ряд показателей с равноот­стоящими моментами времени или равноинтервальный ряд рас­пределения, расчет может быть упрощен. Сокращенные способы расчета дисперсии базируются на знании свойств дисперсии. Свойства дисперсии:

Если от всех значений варианты х отнять (прибавить) по­стоянное число А, то дисперсия не изменится;

Если каждое значение варианты разделить (умножить) на постоянную величину к, то дисперсия уменьшится (увеличится) в к 2 раз.

Сокращенные способы расчета дисперсии:

2. Способ моментов – применяется только в случае равенства интервалов.

Вариация признака определяется различными факторами, часть этих факторов можно выделить, если статистическую совокупность разделить на группы по определенному признаку. Тогда, наряду с изучением вариации признака по совокупности в целом, можно изучить вариацию для каждой из составляющих ее группы и между этими группами. В простом случае, когда совокупность разделена на группы по одному фактору, изучение вариации достигается посредством вычисления и анализа трех видов дисперсий: общей, межгрупповой и внутригрупповой.

Эмпирический коэффициент детерминации

Эмпирический коэффициент детерминации широко применяется в статистическом анализе и является показателем, представляющим долю межгруппопой дисперсии в результативного признака и характеризует силу влияния группировочного признака на образование общей вариации. Он может быть рассчитан по формуле:

Показывает долю вариации результативного признака у под влиянием факторного признака х, он связан с коэффициентом корреляции квадратичной зависимостью. При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной связи - единице.

Например, когда изучается зависимость производительности труда рабочих от их квалификации коэффициент детерминации равен 0,7, то на 70% вариация производительности труда рабочих обусловлена различиями в их квалификации и на 30% - влиянием прочих факторов.

Эмпирическое корреляционное отношение - это квадратный корень из коэффициента детерминации. Отношение показывает тесноту связи между группировочным и результативным признаками. Эмпирическое корреляционное отношение принимает значения от -1 до 1. Если связи нет, то корреляционное отношение равняется нулю, т.е. все групповые средние равняются между собой и межгрупповой вариации нет. Значит, группировочный признак не влияет на образование общей вариации.

Если связь функциональная, то корреляционное отношение равняется единице. В таком случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповой вариации нет. Это значит, что группировочный признак полностью определяет вариацию результативного признака.

Чем ближе значение корреляционного отношения к единице, тем сильнее и ближе к функциональной зависимости связь между признаками. Для качественной оценки силы связи на основе показателя эмпирического коэффициента корреляции можно использовать соотношение Чэддока.

Соотношение Чэддока

  • Связь весьма тесная — коэффициент корреляции находится в интервале 0,9 — 0,99
  • Связь тесная — Rxy = 0,7 — 0,9
  • Связь заметная — Rxy = 0,5 — 0,7
  • Связь умеренная — Rxy = 0,3 — 0,5
  • Связь слабая — Rxy = 0,1 — 0,3

Вариация - это несовпадение значений одной и той же статистиче­ской величины у разных объектов в силу особенностей их собственного развития, а также различия условий, в которых они находятся. Вариация имеет объективный характер и помогает познать сущность изучаемого явления. Если средняя величина сглаживает индивидуальные различия, то вариация, наоборот, их подчеркивает, устанавливая типичность или не типичность найденной средней величины для конкретной статистической совокупности. Тем самым можно делать вывод о качественности подобранных статистических данных.

Вариация измеряется с помощью относительных величин, называе­мых коэффициентами вариации и определяемых в виде отношения среднего отклонения к средней величине. Поскольку среднее отклоне­ние может определяться линейным и квадратическим способами, то соответствующими могут быть и коэффициенты вариации. Следова­тельно, коэффициенты вариации надо определять по формулам

линейный; (1.28)

квадратический. (1.29) Значения коэффициента вариации изменяются от 0 до 1 и чем ближе он к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности, а значит и качественнее подобраны статистические данные. При этом критериальным значением коэффициен­та вариации служит 1/3.

То есть средняя величина считается типичной для данной совокуп­ности при λ 0,333 или при ν 0,333. В ином случае средняя величина не типична и требуется пересмотреть статистическую совокупность с целью включения в нее более объективных статистических величин.

Обычно квадратический коэффициент вариации несколько (примерно на 25%) больше линейного, рассчитанные по одним и тем же данным. А значит возможен случай, когда λ 0,333 и ν 0,333, тогда необходимо взять среднюю из этих коэффициентов и по ее значению сделать окончательный вывод о не/типичности найденной средней величины.

С помощью линейного коэффици­ента вариации принципиальный вывод о типичности или не типичности средней величины можно получить проще и быстрее, чем с помощью квадратического. Однако квадратический коэффициент применяется чаще, так как существует несколько способов для вычисления дисперсии.

У такого способа оценки вариации есть и существенный недостаток. Действительно, пусть, например, исходная совокупность рабочих, имеющих средний стаж 15 лет, со стандартным отклонением σ = 10 лет, «состарилась» еще на 15 лет. Теперь= 30 лет, а стандартное отклонение по-прежнему равно 10. Совокупность, ранее бывшая неоднородной (10/15*100 = 66,7%), со временем оказывается, таким образом, вполне однородной (10/30*100 = 33,3 %).

Поэтому возможен дополнительный анализ статистической сово­купности с помощью коэффициента осцилляции , определяемого по формуле

где R - размах вариации в виде разности наибольшего и наимень­шего значений в совокупности статистических величин. То есть

R = Хмах –Хmin, (1.31)

где Xмax и Xmin - максимальное и минимальное значения в совокупно­сти.

При упорядочении статистических величин в совокупности образу­ются группировочные интервалы. Тогда под обозначением ∆Х пони­мается размах интервала, а среднее интервальное значение обозначается ХИ . В случае ориентировки только на квадратический коэффициент ва­риации могут применяться разные методы определения дисперсии.

представляет собой отношение среднего квадратического отклонения к среднему ожидаемому значению и показывает степень отклонения получаемых результатов.
V = -* 100%, Х
гдеV - коэффициент вариации, %;
G- среднее квадратическое отклонение;
X - среднее ожидаемое значение.
Так как коэффициент вариации - величина относительная, то на его размер не оказывают влияние абсолютные значения изучаемого показателя. С помощью коэффициента вариации можно сравнивать даже колебле-
мость признаков, выраженных в разных единицах измерения. Коэффициент вариации изменяется в пределах от 0 до 100%, при этом, значение коэффициента прямо пропорционально силе колеблемости. Установлена следующая качественная оценка различных коэффициентов вариации:
до 10% - слабая колеблемость;
10-25% - умеренная колеблемость;
свыше 25% - высокая колеблемость.
В качестве варианта может быть использован несколько упрощенный метод определения степени риска. Так как количественно риск характеризуется оценкой вероятной величины максимального и минимального результатов, то «чем больше диапазон между этими величинами при равной их вероятности, тем выше степень риска»1 . Тогда для расчета дисперсии можно использовать следующую формулу:
&2 = PMAX * (max - XУ + Pmin * (X - Xmin У,
2
гдеа2 - дисперсия;
Pmax - вероятность получения максимального результата;
Xmax - максимальная величина результата;
X - средняя ожидаемая величина результата;
Pmjn - вероятность получения минимального результата;
Xmjn - минимальная величина результата.
Полученные показатели следует учитывать в комплексе, так как использование отдельного критерия оценки риска не может служить основой принятия решения в пользу какой-либо стратегии.
В практике встречаются ситуации, когда отсутствует информация о вероятностях состояний среды, т.е. необходима оценка риска в условиях полной неопределенности - (2). В таких случаях для определения наилучших решений используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица. Применение каждого из перечисленных критериев рассмотрим на примере матрицы выигрышей А (1) и матрицы рисков R (2).

Еще по теме Коэффициент вариации:

  1. ВАРИАЦИИ В СТРУКТУРЕ И СТРУКТУРНО-ОБУСЛОВЛЕННЫЕ ВАРИАЦИИ
  2. 1.2.10. Определение. Если существует производная функциив точке, то она называется первой вариацией функционала в точке при данной вариации аргумента, и обозначается:

Вариация измеряется с помощью относительных величин, называемых коэффициентами вариации и определяемых в виде отношения среднего отклонения к средней величине. Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Значения коэффициента вариации изменяются от 0 до 100% и чем ближе он к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности, а значит и качественнее подобраны статистические данные. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Различают следующие относительные показатели вариации:

Коэффициент вариации:

где - среднее квадратическое отклонение, - средняя арифметическая.

Линейный коэффициент вариации:

где - среднее линейное отклонение.

Коэффициент осцилляции:

где - размах вариации.

Вычислим коэффициенты вариации для группы организаций по грузообороту автомобильного транспорта (таблица 5.1) по формулам 5.9, 5.10, 5.11

Коэффициент вариации будет равен: , что превышает 33%, следовательно, совокупность неоднородна.

Вычислим линейный коэффициент вариации: . Следовательно, доля усредненного значения абсолютных отклонений организаций от средней величины равна 30,7%

Найдем коэффициент осцилляции: . Из этого следует, что разница между максимальным и минимальным значениями организаций превышает среднее значение почти в 1,078 раз.

Определим коэффициенты вариации для группировки площадей жилых помещений (в среднем на одного жителя) (таблица 5.3).

Вычислим коэффициент вариации по формуле (5.9):

. Это значит что коэффициент вариации не превышает 33%, следовательно, совокупность однородна.

Рассчитаем линейный коэффициент вариации по формуле (5.10):

. Это значит, что доля усредненного значения абсолютных отклонений площадей жилых помещений от средней величины равна 5,56%.

Найдем коэффициент осцилляции по формуле (5.11):

. Разница между максимальным и минимальным значениями площадей жилых помещений не превышает среднее значение.

РАСЧЕТ И ПОСТРОЕНИЕ СТРУКТУРНЫХ ХАРАКТЕРИСТИК ВАРИАЦИОННОГО РЯДА

Немного больше по теме

Повышение эффективности работы предприятия
В настоящее время все более актуальным становится получение информации для эффективного управления. В условиях жесткой рыночной экономики предприятию нужно эффективно работать при условии максимального использования всех имеющихся ресурсов, просчета всех имеющихся вариантов, нахождения самого эффективного решения, а самое главное, оптимального соотношения затрат и результатов деят...



Декларация по УСН