Рядом распределения
называется упорядоченное распределение единиц совокупности
на группы по какому-либо признаку. Виды рядов распределения:
атрибутивный;
вариационный;
дискретный;
интервальный.
Иными словами, ряд распределения — результат группировки. Под атрибутивным рядом
понимается ряд распределения по атрибутивному признаку
, не имеющему количественной меры. Например, атрибутивный ряд можно составить по признаку «Социальное положение», «Профессия», «Пол» и.т.д.
Пример 6.1. Атрибутивный ряд распределения
На предприятии провели группировку работников по признаку «Категория».
Категория |
Частота |
Частость, % |
Рабочие |
70 |
58,3 |
Служащие |
20 |
16,7 |
ИТР |
25 |
12,5 |
Прочие |
15 |
12,5 |
Итого |
120 |
100,0 |
Частота
— количество элементов совокупности, которые имеют данное значение признака.
Частость
— отношение частоты к общему количеству исследуемых элементов, т.е. объему совокупности. Частоту обозначим n, частость — р или j.
Пример 6.2. Пример дискретного ряда
.
Успеваемость в группе студентов-экономистов из 15 человек по одному из предметов.
Оценки |
Частота |
Частость , % |
2 |
2 |
13,3 |
3 |
4 |
26,7 |
4 |
5 |
33,3 |
5 |
4 |
26,7 |
Итого |
15 |
100,0 |
В интервальном ряду
значение признака представляется в виде интервалов.
Пример 6.3. Пример интервального ряда
Заработная плата, руб. |
Частота |
Частость, % |
100—200 |
20 |
10 |
200—300 |
100 |
50 |
300—400 |
50 |
25 |
400—500 |
10 |
5 |
500—600 |
20 |
10 |
Итого |
200 |
100 |
Важно помнить: в интервальном ряду в качестве основного показателя интервала используется середина интервала х.
Для наглядного представления вариационных рядов
используют графические методы
: полигоны частот, гистограммы, кумулятивные кривые и т.п. Линейчатые
и круговые
диаграммы строятся для отображения структуры совокупности.
Наряду с диаграммами для наглядного представления распределения признака применяют такие линии, как полигон, кумулята, огива
и др.
Полигон
— ломаная кривая, строящаяся на основе прямоугольной системы координат, когда по оси X откладываются значения признака, а по оси Y — частоты (рис. 6.1
).
Гладкая кривая
, соединяющая точки, — эмпирическая плотность распределения.
Кумулята
— ломаная кривая, строящаяся на основе прямоугольной системы координат, когда по оси X откладываются значения признака, а по оси Y — накопленные частоты (рис. 6.2
).
Для дискретных рядов на оси откладываются сами значения признака, а для интервальных — середины интервалов.
На основе гистограмм
можно строить диаграммы накопленных частот с последующим построением интегральной эмпирической функции распределения.
Средние величины
— в статистическом понимании это обобщающие показатели совокупности однотипных явлений по какому-либо количественному признаку
. Цели определения средних величин следующие:
ослабить влияние случайных факторов на изучаемый показатель;
получить сводный показатель, описывающий данную совокупность в целом.
Иначе говоря, средние величины — это концентраторы информации: вместо совокупности признаков получается один показатель, используемый для дальнейшего анализа.
Важнейшим условием определения достоверности
средних величин является однородность изучаемой совокупности. Нарушение этого требования приводит к появлению фиктивных средних
, искажающих статистические выводы. Совокупность
считается однородной по какому-либо признаку, если все
составляющие ее единицы относятся к одному и тому же типу и значения признака формируются под влиянием общих, систематически действующих факторов.
Средняя арифметическая
исчисляется для сгруппированных данных по формуле:
где xi — варианты значения признака;
fi — частоты.
При вычислении средней арифметической возможные типичные ошибки заключаются в следующем.
Засоренность выборки нетипичными значениями.
Пример 6.4.
Уставный фонд АО разделен акциями 1000 шт. по 1000 руб. следующим образом.
460 акционеров владеют 1 акцией, 10 — 2, 5 — 4, 1 — 500.
Какова будет величина капитала, приходящегося на 1 акционера?
К = (460 × 1 + 10× 2 + 5 × 4 + 1 × 500) / (460 + 10 + 5 + 1) = 2,1 тыс. рублей.
Изменение состава усредняемой совокупности.
Маскировка или взаимная компенсация отклонения.
Средняя гармоническая
применяется в тех случаях, когда известны варианты признака, его объемное значение, но не известны частоты.
Средняя геометрическая
— это показатель, используемый при расчете индексов.
Мода
— наиболее типичное, чаще всего встречаемое значение признака. В случаях интервальных рядов с равными интервалами, модальным интервалом считается интервал с наибольшей частотой, а при неравных интервалах — интервал с наибольшей плотностью.
Пример 6.5. Вычисление моды вариационного интервального ряда
Интервал |
Частота |
70—80 |
2 |
80—90 |
10 |
90—100 |
30 |
100—110 |
45 |
110—120 |
13 |
Mo = 100 + 10 × (45 - 30) / ((45 - 30) + (45 - 13)) = 103,2.
Медиана
— значение варьирующего признака, приходящееся на середину ранжированной совокупности. При исчислении медианы интервального ряда сначала находится интервал, содержащий медиану. Медианному интервалу соответствует первый из интервалов, для которых накопленная сумма
частот превышает половину общей совокупности наблюдений.
Внутри найденного интервала расчет медианы производится по формуле Ме = xlе , где второй множитель в правой части равенства показывает расположение медианы внутри медианного интервала, а х — длина этого интервала.
Медиана делит вариационный ряд
пополам по частотам. Определяют еще квартили, которые делят вариационный ряд на 4 равновеликие по вероятности части, и децили, делящие ряд на 10 равновеликих частей.
Вопросы для самопроверки
Что такое ряд распределения?
Какие вы знаете виды рядов распределения?
С какой целью ряды распределения изображают графически?
Какие вы знаете графические изображения рядов распределения?
Что собой представляют средние значения?
Какие виды средних вы знаете?
Какую роль играет однородность совокупности при выборе средней?
Что такое структурные средние?
Как строят кумуляту?
© 2006—2013
ЦДОТ Московский Университет им. С.Ю. Витте |
|
|
|||||||||