Статистика Часть 1:
6.
Ряды распределения и средние величины
6.1.
Дискретные и интервальные ряды распределения

Рядом распределения называется упорядоченное распределение единиц совокупности на группы по какому-либо признаку. Виды рядов распределения:

Иными словами, ряд распределения — результат группировки. Под атрибутивным рядом понимается ряд распределения по атрибутивному признаку, не имеющему количественной меры. Например, атрибутивный ряд можно составить по признаку «Социальное положение», «Профессия», «Пол» и.т.д.

Пример 6.1. Атрибутивный ряд распределения

На предприятии провели группировку работников по признаку «Категория».

Untitled Document

Категория

Частота

Частость, %

Рабочие

70

58,3

Служащие

20

16,7

ИТР

25

12,5

Прочие

15

12,5

Итого

120

100,0

Частота — количество элементов совокупности, которые имеют данное значение признака.

Частость — отношение частоты к общему количеству исследуемых элементов, т.е. объему совокупности. Частоту обозначим n, частость — р или j.

Пример 6.2. Пример дискретного ряда.

Успеваемость в группе студентов-экономистов из 15 человек по одному из предметов.

Untitled Document

Оценки

Частота

Частость , %

2

2

13,3

3

4

26,7

4

5

33,3

5
4
26,7

Итого

15

100,0

В интервальном ряду значение признака представляется в виде интервалов.

Пример 6.3. Пример интервального ряда

Untitled Document

Заработная плата, руб.

Частота

Частость, %

100—200

20

10

200—300

100

50

300—400

50

25

400—500

10

5

500—600

20

10

Итого

200

100

Важно помнить: в интервальном ряду в качестве основного показателя интервала используется середина интервала х.

Для наглядного представления вариационных рядов используют графические методы: полигоны частот, гистограммы, кумулятивные кривые и т.п. Линейчатые и круговые диаграммы строятся для отображения структуры совокупности.

Наряду с диаграммами для наглядного представления распределения признака применяют такие линии, как полигон, кумулята, огива и др.

Полигон — ломаная кривая, строящаяся на основе прямоугольной системы координат, когда по оси X откладываются значения признака, а по оси Y — частоты (рис. 6.1).

Гладкая кривая, соединяющая точки, — эмпирическая плотность распределения.

Кумулята — ломаная кривая, строящаяся на основе прямоугольной системы координат, когда по оси X откладываются значения признака, а по оси Y — накопленные частоты (рис. 6.2).

Для дискретных рядов на оси откладываются сами значения признака, а для интервальных — середины интервалов.

На основе гистограмм можно строить диаграммы накопленных частот с последующим построением интегральной эмпирической функции распределения.

6.2.
Средние величины

Средние величины — в статистическом понимании это обобщающие показатели совокупности однотипных явлений по какому-либо количественному признаку. Цели определения средних величин следующие:

Иначе говоря, средние величины — это концентраторы информации: вместо совокупности признаков получается один показатель, используемый для дальнейшего анализа.

Важнейшим условием определения достоверности средних величин является однородность изучаемой совокупности. Нарушение этого требования приводит к появлению фиктивных средних, искажающих статистические выводы. Совокупность считается однородной по какому-либо признаку, если все составляющие ее единицы относятся к одному и тому же типу и значения признака формируются под влиянием общих, систематически действующих факторов.

Средняя арифметическая исчисляется для сгруппированных данных по формуле:

, (6.1)

где xi — варианты значения признака;

fi — частоты.

При вычислении средней арифметической возможные типичные ошибки заключаются в следующем.

Средняя гармоническая применяется в тех случаях, когда известны варианты признака, его объемное значение, но не известны частоты.

Средняя геометрическая — это показатель, используемый при расчете индексов.

6.3.
Структурные средние

Мода — наиболее типичное, чаще всего встречаемое значение признака. В случаях интервальных рядов с равными интервалами, модальным интервалом считается интервал с наибольшей частотой, а при неравных интервалах — интервал с наибольшей плотностью.

Пример 6.5. Вычисление моды вариационного интервального ряда

Untitled Document

Интервал

Частота

70—80

2

80—90

10

90—100

30

100—110

45

110—120

13

Mo = 100 + 10 × (45 - 30) / ((45 - 30) + (45 - 13)) = 103,2.

Медиана — значение варьирующего признака, приходящееся на середину ранжированной совокупности. При исчислении медианы интервального ряда сначала находится интервал, содержащий медиану. Медианному интервалу соответствует первый из интервалов, для которых накопленная сумма частот превышает половину общей совокупности наблюдений.

. (6.2).

Внутри найденного интервала расчет медианы производится по формуле Ме = xlе , где второй множитель в правой части равенства показывает расположение медианы внутри медианного интервала, а х — длина этого интервала.

Медиана делит вариационный ряд пополам по частотам. Определяют еще квартили, которые делят вариационный ряд на 4 равновеликие по вероятности части, и децили, делящие ряд на 10 равновеликих частей.

Вопросы для самопроверки

  • Что такое ряд распределения?

  • Какие вы знаете виды рядов распределения?

  • С какой целью ряды распределения изображают графически?

  • Какие вы знаете графические изображения рядов распределения?

  • Что собой представляют средние значения?

  • Какие виды средних вы знаете?

  • Какую роль играет однородность совокупности при выборе средней?

  • Что такое структурные средние?

  • Как строят кумуляту?



Менеджер ДО [E-Mail: info@e-college.ru]  E-Mail:  info@e-college.ru