Составить интервальный ряд. Построение интервального вариационного ряда для непрерывных количественных данных. Методика выполнения лабораторной работы

Что такое группировка статистических данных, и как она связана с рядами распределения, было рассмотрено этой лекции, там же можно узнать, о том что такое дискретный и вариационный ряд распределения.

Ряды распределения одна из разновидностей статистических рядов (кроме них в статистике используются ряды динамики), используются для анализа данных о явлениях общественной жизни. Построение вариационных рядов вполне посильная задача для каждого. Однако есть правила, которые необходимо помнить.

Как построить дискретный вариационный ряд распределения

Пример 1. Имеются данные о количестве детей в 20 обследованных семьях. Построить дискретный вариационный ряд распределения семей по числу детей .

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Решение:

  1. Начнем с макета таблицы, в которую затем мы внесем данные. Так как ряды распределения имеют два элемента, то таблица состоять будет из двух колонок. Первая колонка это всегда варианта – то, что мы изучаем – ее название берем из задания (конец предложения с заданием в условиях) — по числу детей – значит наша варианта это число детей.

Вторая колонка это частота – как часто встречается наша варианта в исследуемом явление – название колонки так же берем из задания — распределения семей – значит наша частота это число семей с соответствующим количеством детей.

  1. Теперь из исходных данных выберем те значения, которые встречаются хотя бы один раз. В нашем случае это

И расставим эти данные в первой колонке нашей таблицы в логическом порядке, в данном случае возрастающем от 0 до 4. Получаем

И в заключение подсчитаем, сколько же раз встречается каждое значение варианты.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

В результате получаем законченную табличку или требуемый ряд распределения семей по количеству детей.

Задание . Имеются данные о тарифных разрядах 30 рабочих предприятия. Построить дискретный вариационный ряд распределения рабочих по тарифному разряду. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Как построить интервальный вариационный ряд распределения

Построим интервальный ряд распределения, и посмотрим чем же его построение отличается от дискретного ряда.

Пример 2. Имеются данные о величине полученной прибыли 16 предприятий, млн. руб. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Построить интервальный вариационный ряд распределения предприятий по объему прибыли, выделив 3 группы с равными интервалами.

Общий принцип построения ряда, конечно же, сохраниться, те же две колонки, те же варианта и частота, но в здесь варианта будет располагаться в интервале и подсчет частот будет вестись иначе.

Решение:

  1. Начнем аналогично предыдущей задачи с построения макета таблицы, в которую затем мы внесем данные. Так как ряды распределения имеют два элемента, то таблица состоять будет из двух колонок. Первая колонка это всегда варианта – то, что мы изучаем – ее название берем из задания (конец предложения с заданием в условиях) — по объему прибыли – значит, наша варианта это объем полученной прибыли.

Вторая колонка это частота – как часто встречается наша варианта в исследуемом явление – название колонки так же берем из задания — распределения предприятий – значит наша частота это число предприятий с соответствующей прибылью, в данном случае попадающие в интервал.

В итоге макет нашей таблицы будет выглядеть так:

где i – величина или длинна интервала,

Хmax и Xmin – максимальное и минимальное значение признака,

n – требуемое число групп по условию задачи.

Рассчитаем величину интервала для нашего примера. Для этого среди исходных данных найдем самое большое и самое маленькое

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 – максимальное значение 118 млн. руб., и минимальное 9 млн. руб. Проведем расчет по формуле.

В расчете получили число 36,(3) три в периоде, в таких ситуациях величину интервала нужно округлить до большего, чтобы после подсчетов не потерялось максимальное данное, именно поэтому в расчете величина интервала 36,4 млн. руб.

  1. Теперь построим интервалы – наши варианты в данной задаче. Первый интервал начинают строить от минимального значения к нему добавляется величина интервала и получается верхняя граница первого интервала. Затем верхняя граница первого интервала становится нижней границей второго интервала, к ней добавляется величина интервала и получается второй интервал. И так далее столько раз сколько требуется построить интервалов по условию.

Обратим внимание если бы мы не округлили величину интервала до 36,4, а оставили бы ее 36,3, то последнее значение у нас бы получилось 117,9. Именно для того чтобы не было потери данных необходимо округлять величину интервала до большего значения.

  1. Проведем подсчет количества предприятий попавших в каждый конкретный интервал. При обработке данных необходимо помнить, что верхнее значение интервала в данном интервале не учитывается (не включается в этот интервал), а учитывается в следующем интервале (нижняя граница интервала включается в данный интервал, а верхняя не включается), за исключением последнего интервала.

При проведении обработки данных лучше всего отобранные данные обозначить условными значками или цветом, для упрощения обработки.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Первый интервал обозначим желтым цветом – и определим сколько данных попадает в интервал от 9 до 45,4, при этом данное 45,4 будет учитываться во втором интервале (при условии что оно есть в данных) – в итоге получаем 7 предприятий в первом интервале. И так дальше по всем интервалам.

  1. (дополнительное действие ) Проведем подсчет общего объема прибыли полученного предприятиями по каждому интервалу и в целом. Для этого сложим данные отмеченные разными цветами и получим суммарное значение прибыли.

По первому интервалу — 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 млн. руб.

По второму интервалу — 48 + 57 + 48 + 56 + 63 = 272 млн. руб.

По третьему интервалу — 118 + 87 + 98 + 88 = 391 млн. руб.

Задание . Имеются данные о величине вклада в банке 30 вкладчиков, тыс. руб. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Построить интервальный вариационный ряд распределения вкладчиков, по размеру вклада выделив 4 группы с равными интервалами. По каждой группе подсчитать общий размер вкладов.

При построении интервального ряда распределения решаются три вопроса:

  • 1. Сколько надо взять интервалов?
  • 2. Какова длина интервалов?
  • 3. Каков порядок включения единиц совокупности в границы интервалов?
  • 1. Количество интервалов можно определить по формуле Стер- джесса :

2. Длина интервала, или шаг интервала , обычно определяется по формуле

где R - размах вариации.

3. Порядок включения единиц совокупности в границы интервала

может быть разным, но при построении интервального ряда распределения обязательно строго определен.

Например, такой: [), при котором единицы совокупности в нижние границы включаются, а в верхние - не включаются, а переносятся в следующий интервал. Исключение в этом правиле составляет последний интервал , верхняя граница которого включает последнее число ранжированного ряда.

Границы интервалов бывают:

  • закрытые - с двумя крайними значениями признака;
  • открытые - с одним крайним значением признака (до такого-то числа или свыше такого-то числа).

С целью усвоения теоретического материала введем исходную информацию для решения сквозной задачи.

Имеются условные данные по среднесписочной численности менеджеров по продажам, количеству проданного ими однокачественного товара, индивидуальной рыночной цене на этот товар, а также объему продаж 30 фирм в одном из регионов РФ в I квартале отчетного года (табл. 2.1).

Таблица 2.1

Исходная информация для сквозной задачи

Численность

менеджеров,

Цена, тыс. руб.

Объем продаж, млн руб.

Численность

менеджеров,

Количество проданного товара, шт.

Цена, тыс. руб.

Объем продаж, млн руб.

На базе исходной информации, а также дополнительной сделаем постановку отдельных заданий. Затем представим методику их решения и сами решения.

Сквозная задача. Задание 2.1

Используя исходные данные табл. 2.1, требуется построить дискретный ряд распределения фирм по количеству проданного товара (табл. 2.2).

Решение:

Таблица 2.2

Дискретный ряд распределения фирм по количеству проданного товара в одном из регионов РФ в I квартале отчетного года

Сквозная задача. Задание 2.2

требуется построить ранжированный ряд 30 фирм по среднесписочной численности менеджеров.

Решение:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Сквозная задача. Задание 2.3

Используя исходные данные табл. 2.1, требуется:

  • 1. Построить интервальный ряд распределения фирм по численности менеджеров.
  • 2. Рассчитать частости ряда распределения фирм.
  • 3. Сделать выводы.

Решение:

Рассчитаем по формуле Стерджесса (2.5) количество интервалов :

Таким образом, берем 6 интервалов (групп).

Длину интервала , или шаг интервала , рассчитаем по формуле

Примечание. Порядок включения единиц совокупности в границы интервала такой: I), при котором единицы совокупности в нижние границы включаются, а в верхние - не включаются, а переносятся в следующий интервал. Исключение в этом правиле составляет последний интервал I ], верхняя граница которого включает последнее число ранжированного ряда.

Строим интервальный ряд (табл. 2.3).

Интервальный ряд распределения фирм но среднесписочной численности менеджеров в одном из регионов РФ в I квартале отчетного года

Вывод. Наиболее многочисленной группой фирм является группа со среднесписочной численностью менеджеров 25- 30 человек, которая включает 8 фирм (27%); в самую малочисленную группу со среднесписочной численностью менеджеров 40-45 человек входит всего одна фирма (3%).

Используя исходные данные табл. 2.1, а также интервальный ряд распределения фирм по численности менеджеров (табл. 2.3), требуется построить аналитическую группировку зависимости между численностью менеджеров и объемом продаж фирм и на основании ее сделать вывод о наличии (или отсутствии) связи между указанными признаками.

Решение:

Аналитическая группировка строится по факторному признаку. В нашей задаче факторным признаком (х) является численность менеджеров, а результативным признаком (у) - объем продаж (табл. 2.4).

Построим теперь аналитическую группировку (табл. 2.5).

Вывод. На основании данных построенной аналитической группировки можно сказать, что с увеличением численности менеджеров по продажам средний в группе объем продаж фирмы также увеличивается, что свидетельствует о наличии прямой связи между указанными признаками.

Таблица 2.4

Вспомогательная таблица для построения аналитической группировки

Численность менеджеров, чел.,

Номер фирмы

Объем продаж, млн руб., у

» = 59 f = 9,97

Я-™ 4 - Ю.22

74 ’25 1ПЙ1

У4 = 7 = 10,61

у = ’ =10,31 30

Таблица 2.5

Зависимость объемов продаж от численности менеджеров фирм в одном из регионов РФ в I квартале отчетного года

КОНТРОЛЬНЫЕ ВОПРОСЫ
  • 1. В чем суть статистического наблюдения?
  • 2. Назовите этапы статистического наблюдения.
  • 3. Каковы организационные формы статистического наблюдения?
  • 4. Назовите виды статистического наблюдения.
  • 5. Что такое статистическая сводка?
  • 6. Назовите виды статистических сводок.
  • 7. Что такое статистическая группировка?
  • 8. Назовите виды статистических группировок.
  • 9. Что такое ряд распределения?
  • 10. Назовите конструктивные элементы ряда распределения.
  • 11. Каков порядок построения ряда распределения?
Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку.

Назначение сервиса . С помощью онлайн-калькулятора Вы сможете:

  • построить вариационный ряд , построить гистограмму и полигон;
  • найти показатели вариации (среднюю, моду (в т.ч. и графическим способом), медиану, размах вариации, квартили, децили, квартильный коэффициент дифференциации, коэффициент вариации и другие показатели);

Инструкция . Для группировки ряда необходимо выбрать вид получаемого вариационного ряда (дискретный или интервальный) и указать количество данных (количество строк). Полученное решение сохраняется в файле Word (см. пример группировки статистических данных).

Количество исходных данных
",0);">

Если группировка уже осуществлена и заданы дискретный вариационный ряд или интервальный ряд , то необходимо воспользоваться онлайн-калькулятором Показатели вариации . Проверка гипотезы о виде распределения производится с помощью сервиса Изучение формы распределения .

Виды статистических группировок

Вариационный ряд . В случае наблюдений дискретной случайной величины одно и то же значение можно встретить несколько раз. Такие значения x i случайной величины записывают с указанием n i числа раз его появления в n наблюдениях, это и есть частота данного значения.
В случае непрерывной случайной величины на практике применяют группировку.
  1. Типологическая группировка – это разделение исследуемой качественно разнородной совокупности на классы, социально–экономические типы, однородные группы единиц. Для построения данной группировки используйте параметр Дискретный вариационный ряд.
  2. Структурной называется группировка , в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому–либо варьирующему признаку. Для построения данной группировки используйте параметр Интервальный ряд.
  3. Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитической группировкой (см. аналитическая группировка ряда).

Принципы построения статистических группировок

Ряд наблюдений, упорядоченных по возрастанию, называется вариационным рядом . Группировочным признаком называется признак, по которому производится разбивка совокупности на отдельные группы. Его называют основанием группировки. В основание группировки могут быть положены как количественные, так и качественные признаки.
После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность.

При использовании персональных компьютеров для обработки статистических данных группировка единиц объекта производится с помощью стандартных процедур.
Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп:

k = 1+3,322*lg(N)

Где k – число групп, N – число единиц совокупности.

Длину частичных интервалов вычисляют как h=(x max -x min)/k

Затем подсчитывают числа попаданий наблюдений в эти интервалы, которые принимают за частоты n i . Малочисленные частоты, значения которых меньше 5 (n i < 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
В качестве новых значений вариант берут середины интервалов x i =(c i-1 +c i)/2.

Признаки, изучаемые статистикой, варьируются (отличаются друг от друга) у различных единиц совокупности в один и тот же период или момент времени. Например, величина внешнеторгового оборота варьируется по подразделениям ФТС; величина экспорта (импорта) варьируется по направлениям экспорта (по разным странам-партнерам по внешней торговле), по видам товаров и т.п.

Причиной вариации являются разные условия существования разных единиц совокупности. Например, огромное число причин влияет на масштабы внешней торговли различных стран мира.

Для управления и изучения вариации статистикой разработаны специальные методы исследования вариации, система показателей, с помощью которой вариация измеряется, характеризуются ее свойства.

Первым этапом статистического изучения вариации является построение ряда распределения (или вариационного ряда ) – упорядоченного распределения единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.

Существует 3 вида ряда распределения:

1) ранжированный ряд – это перечень отдельных единиц совокупности в порядке возрастания изучаемого признака (например, таблица 11); если численность единиц совокупности достаточно велика ранжированный ряд становится громоздким, и в таких случаях ряд распределения строится с помощью группировки единиц совокупности по значениям изучаемого признака (ели признак принимает небольшое число значений, то строится дискретный ряд, а в противном случае – интервальный ряд);

2) дискретный ряд – это таблица, состоящая из двух столбцов (строк) – конкретных значений варьирующего признака Xi и числа единиц совокупности с данным значением признака fi – частот; число групп в дискретном ряду определяется числом реально существующих значений варьирующего признака;

3) интервальный ряд – это таблица, состоящая из двух столбцов (строк) – интервалов варьирующего признака Xi и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа в общей численности совокупностей (частостей).

Построим ряд распределения внешнеторгового оборота (ВО) по таможенным постам России, для чего необходимо провести статистическое наблюдение, то есть собрать первичный статистический материал, который представляет собой величину ВО по таможенным постам.

Результаты наблюдения ВО по 35 таможенным постам региона за отчетный период представим в виде ранжированного по возрастанию величины ВО ряда распределения (таблица 11).

Таблица 11. Внешнеторговый оборот (ВО) по 35 таможенным постам, млн.долл.

№ поста

№ поста

№ поста

Определим средний размер ВО по формуле (10), приняв за X величину ВО, а за N – численность постов:

= = 2100/35 = 60 (млн.долл.)

Дисперсию (о ней будет рассказано чуть позднее – на 4-м этапе анализа вариации в этой теме) определим по формуле (28):

= = 445,778 (млн.долл.2)

Построим интервальный ряд распределения ВО по таможенным постам, для чего необходимо выбрать оптимальное число групп (интервалов признака) и установить длину (размах) интервала. Поскольку при анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной . Оптимальное число групп выбирается так, чтобы достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения.

Чаще всего число групп в ряду распределения определяют по формуле Стерждесса (19) или (20):

(19) или ,(20)

где k – число групп (округляемое до ближайшего целого числа); N – численность совокупности.

Из формулы Стерджесса видно, что число групп – функция объема данных (N ).

Зная число групп, рассчитывают длину (размах) интервала по формуле (21):

,(21)

где X мax и X min - максимальное и минимальное значения в совокупности.

В нашем примере про ВО по формуле Стерждесса (19) определим число групп:

k = 1 + 3,322lg 35 = 1+ 3,322*1,544 = 6,129 ≈ 6.

Рассчитаем длину (размах) интервала по формуле (21):

h = (111,16 – 24,16)/6 = 87/6 = 14,5 (млн.долл.).

Теперь построим интервальный ряд с 6 группами с интервалом 14,5 млн.долл. (см. первые 3 столбца табл. 12).

Таблица 12. Интервальный ряд распределения ВО по таможенным постам, млн.долл.

Группы постов по величине ВО

Число постов

Середина интервала

Х i’fi

Накопл. частота

| Хi - | fi

(Х i - )2 fi

(Х i - )3 fi

(Х i - )4 fi

96,66 – 111,16

Существенную помощь в анализе ряда распределения и его свойств оказывает графическое изображение. Интервальный ряд изображается столбиковой диаграммой, в которой основания столбиков, расположенные по оси абсцисс, – это интервалы значений варьирующего признака, а высоты столбиков – частоты, соответствующие масштабу по оси ординат. Графическое изображение распределения таможенных постов в выборке по величине ВО приведено на рис. 4. Диаграмма такого типа называется гистограммой .

Рис. 4. Гистограмма распределения Рис. 5. Полигон распределения

Данные табл. 12 и рис. 4 показывают характерную для многих признаков форму распределения: чаще встречаются значения средних интервалов признака, реже – крайние (малые и большие) значения признака. Форма этого распределения близка к нормальному закону распределения, которое образуется, если на варьирующую переменную влияет большое число факторов, ни один из которых не имеет преобладающего значения.

Если имеется дискретный ряд распределения или используются середины интервалов (как в нашем примере про ВО – в таблице 12 в 4-м столбце рассчитаны середины интервалов как полусумма значений начала и конца интервала), то графическое изображение такого ряда называется полигоном (см. рис. 5) , которое получается соединением прямыми точек с координатами Xi и fi .

Описание изменений варьирующего признака осуществляется с помощью рядов распределения.

Статистический ряд распределения - это упорядоченное распределение единиц статистической совокупности на отдельные группы по определенному варьирующему признаку.

Статистические ряды, построенные по качественному признаку называют атрибутивными . Если в основе ряда распределения лежит количественный признак, то ряд является вариационным .

В свою очередь вариационные ряды делят на дискретные и интервальные. В основе дискретного ряда распределения лежит дискретный (прерывный) признак, принимающий конкретные числовые значения (число правонарушений, число обращений граждан за юридической помощью). Интервальный ряд распределения строится на основе непрерывного признака, который может принимать любые значения из заданного диапазона (возраст осужденного, срок лишения свободы и т.д.)

Любой статистический ряд распределения содержит два обязательных элемента – варианты ряда и частоты. Варианты (x i ) – отдельные значения признака, которые он принимает в ряду распределения. Частоты (f i ) – это числовые значения, показывающие сколько раз встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности.

Частоты, выраженные в относительных единицах (долях или процентах) называются частостями (w i ). Сумма частостей равна единице, если Частости выражены в долях единицы, или 100, если они выражаются в процентах. Использование частостей позволяет производить сравнение вариационных рядов с разным объемом совокупности. Частости определяются по следующей формуле:

Для построения дискретного ряда ранжируются все встречающиеся в ряду индивидуальные значения признака, а затем подсчитываются частоты повторений каждого значения. Оформляется ряд распределения в идее таблицы, состоящей из двух строк и столбцов, в одной из которых приводятся значения вариантов ряда x i , во второй – значения частот f i .

Рассмотрим пример построения дискретного вариационного ряда.

Пример 3.1 . По данным УМВД зарегистрировано преступлений, совершенных в городе N несовершеннолетними в возрасте.

17 13 15 16 17 15 15 14 16 13 14 17 14 15 15 16 16 15 14 15 15 14 16 16 14 17 16 15 16 15 13 15 15 13 15 14 15 13 17 14.

Построить дискретный ряд распределения.

Решение .

Сначала необходимо проранжировать данные о возрасте несовершеннолетних, т.е. записать их в порядке возрастания.

13 13 13 13 13 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17



Таблица 3.1

Таким образом, частоты отображают количество человек данного возраста, например, 5 человек имеют возраст 13 лет, 8 человек – 14 лет, и т.д.

Построение интервальных рядов распределения осуществляют аналогично выполнению равноинтервальной группировки по количественному признаку, то есть вначале определяют оптимальное число групп, на которые будет разбита совокупность, устанавливаются границы интервалов по группам и подсчитываются частоты.

Проиллюстрируем построение интервального ряда распределения на следующем примере.

Пример 3.2 .

Построить интервальный ряд по следующей статистической совокупности – заработной плате юриста в конторе, тыс. руб.:

16,0 22,2 25,1 24,3 30,5 32,0 17,0 23,0 19,8 27,5 22,0 18,9 31,0 21,5 26,0 27,4

Решение.

Примем оптимальное количество групп равноинтервальной группировки для данной статистической совокупности, равное 4 (у нас 16 вариантов). Следовательно, численность каждой группы равна:

а величина каждого интервала будет равна:

Границы интервалов определяем по формулам:

,

где - соответственно нижняя и верхняя границы i-го интервала.

Опуская промежуточные вычисления границ интервалов, заносим их значения (варианты) и количество юристов (частоты), имеющих з/п в пределах каждого интервала, в таблицу 3.2, которая и иллюстрирует полученный интервальный ряд.

Таблица 3.2

Анализ статистических рядов распределения может производиться с использованием графического метода. Графическое представление рядов распределения позволяет наглядно проиллюстрировать закономерности распределения исследуемой совокупности путем ее изображения в виде полигона, гистограммы и кумуляты. Остановимся на каждом из перечисленных графиков.

Полигон – ломаная, отрезки которой соединяют точки с координатами (x i ;f i ). Обычно полигон используют для изображения дискретных рядов распределения. Для его построения на оси абсцисс откладывают ранжированные индивидуальные значения признака x i , на оси ординат – соответствующие этим значениям частоты. В результате, соединив отрезками точки, соответствующие данным, отмеченным по осям абсцисс и ординат, получают ломаную, называемую полигоном. Приведем пример построения полигона частот.

Для иллюстрации построения полигона возьмем результат решения примера 3.1 на построение дискретного ряда – рисунок 1. По оси абсцисс отложен возраст осужденных, по оси ординат – количество несовершеннолетних осужденных, имеющих данный возраст. Анализируя данный полигон, можно сказать, что наибольшее количество осужденных – 14 человек, имеют возраст 15 лет.

Рисунок 3.1 – Полигон частот дискретного ряда.

Полигон можно построить и для интервального ряда, в этом случае по оси абсцисс откладывают середины интервалов, а по оси ординат – соответствующие им частоты.

Гистограмма – ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат интервалы значения признака, а высоты равны соответствующим частотам. Гистограмма применяется только для изображения интервальных рядов распределения. Если интервалы являются неравными, то для построения гистограммы на оси ординат откладывают не частоты, а отношение частоты к ширине соответствующего интервала. Гистограмму можно преобразовать в полигон распределения, если середины ее столбиков соединить между собой отрезками.

Для иллюстрации построения гистограммы возьмем результаты построения интервального ряда из примера 3.2– рисунок 3.2.

Рисунок 3.2 – Гистограмма распределения заработной платы юристов.

Для графического изображения вариационных рядов также используют кумуляту. Кумулята – кривая, изображающая ряд накопленных частот и соединяющая точки с координатами (x i ;f i нак ). Накопленные частоты вычисляются последовательным суммированием всех частот ряда распределения и показывают число единиц совокупности, имеющих значение признака не больше, чем указанное. Проиллюстрируем вычисление накопленных частот для вариационного интервального ряда, представленного в примере 3.2 – таблица 3.3.

Таблица 3.3

Для построения кумуляты дискретного ряда распределения по оси абсцисс откладывают ранжированные индивидуальные значения признака, а по оси ординат – соответствующие им накопленные частоты. При построении кумулятивной кривой интервального ряда первая точка будет иметь абсциссу, равную нижней границе первого интервала, а ординату, равную 0. Все последующие точки должны соответствовать верхним граница интервалов. Построим кумуляту, используя данные таблицы 3.3 – рисунок 3.3.

Рисунок 3.3 – Кумулятивная кривая распределения заработной платы юристов.

Контрольные вопросы

1. Понятие статистического ряда распределения, его основные элементы.

2. Виды статистических рядов распределения. Их краткая характеристика.

3. Дискретные и интервальные ряды распределения.

4. Методика построения дискретных рядов распределения.

5. Методика построения интервальных рядов распределения.

6. Графическое изображение дискретных рядов распределения.

7. Графическое изображение интервальных рядов распределения.

Задачи

Задача 1 . Имеются следующие данные об успеваемости 25 студен­тов группы по ТГП в сессию: 5, 4, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5, 5, 2, 3, 3, 5, 4, 2, 3, 3. Постройте дискретный вариационный ряд распределения студентов по баллам оценок, получен­ных в сессию. Для полученного ряда рассчитайте Частости, накопленные Частости, накопленные частоты. Сделайте выводы.

Задача 2 . В колонии содержатся 1000 осужденных, их распределение по возрасту представлено в таблице:

Изобразите данный ряд графически. Сделайте выводы.

Задача 3 . Имеются следующие данные о сроках лишения свободы заключенных:

5; 4; 2; 1; 6; 3; 4; 3; 2; 2; 3; 1; 17; 6; 2; 8; 5; 11; 9; 3; 5; 6; 4; 3; 10; 5; 25; 1; 12; 3; 3; 4; 9; 6; 5; 3; 4; 3; 5; 12; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 3; 12; 6.

Постройте интервальный ряд распределения заключенных по срокам лишения свободы. Сделайте выводы.

Задача 4 . Имеются следующие данные о распределении осужденных в области за изучаемый период по возрастным группам:

Изобразите данный ряд графически, сделайте выводы.



Онлайн калькуляторы