Что значит ранжированный ряд
Ряды распределения. Атрибутные и вариационные ряды распределения. Ранжирования ряда. Характеристики варианта, частота, непрерывность, дискретность. Интервал
Поможем написать любую работу на аналогичную тему
Важнейшей частью статистического анализа является построение рядов распределения (структурной группировки) с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения.
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.
Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд.
Очень часто таблица дополняется графой, в которой подсчитываются накопленные частоты S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение.
Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.:
При построении вариационного ряда с интервальными значениями прежде всего необходимо установить величину интервала i, которая определяется как отношение размаха вариации R к числу групп m:
Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода, или так называемые структурные средние. Если средняя арифметическая рассчитывается на основе использования всех вариантов значений признака, то медиана и мода характеризуют величину того варианта, который занимает определенное среднее положение в ранжированном вариационном ряду.
Для ранжированного ряда с нечетным числом индивидуальных величин (например, 1, 2, 3, 3, 6, 7, 9, 9, 10) медианой будет величина, которая расположена в центре ряда, т.е. пятая величина.
Для ранжированного ряда с четным числом индивидуальных величин (например, 1, 5, 7, 10, 11, 14) медианой будет средняя арифметическая величина, которая рассчитывается из двух смежных величин.
То есть для нахождения медианы сначала необходимо определить ее порядковый номер (ее положение в ранжированном ряду) по формуле
Численное значение медианы определяют по накопленным частотам в дискретном вариационном ряду. Для этого сначала следует указать интервал нахождения медианы в интервальном ряду распределения. Медианным называют первый интервал, где сумма накопленных частот превышает половину наблюдений от общего числа всех наблюдений.
Численное значение медианы
Модой (Мо) называют значение признака, которое встречается наиболее часто у единиц совокупности. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой.
Чтобы найти конкретное значение моды, необходимо использовать формулу
Мода имеет широкое распространение в маркетинговой деятельности при изучении покупательского спроса, особенно при определении пользующихся наибольшим спросом размеров одежды и обуви, при регулировании ценовой политики.
Основной целью анализа вариационных рядов является выявление закономерности распределения, исключая при этом влияние случайных для данного распределения факторов. Этого можно достичь, если увеличивать объем исследуемой совокупности и одновременно уменьшать интервал ряда. При попытке изображения этих данных графически мы получим некоторую плавную кривую линию, которая для полигона частот будет являться некоторым пределом. Эту линию называют кривой распределения.
Иными словами, кривая распределения есть графическое изображение в виде непрерывной линии изменения частот в вариационном ряду, которое функционально связано с изменением вариант. Кривая распределения отражает закономерность изменения частот при отсутствии случайных факторов. Графическое изображение облегчает анализ рядов распределения.
Известно достаточно много форм кривых распределения, по которым может выравниваться вариационный ряд, но в практике статистических исследований наиболее часто используются такие формы, как нормальное распределение и распределение Пуассона.
Нормальное распределение зависит от двух параметров: средней арифметической и среднего квадратического отклонения
. Его кривая выражается уравнением
Если нужно получить теоретические частоты f’ при выравнивании вариационного ряда по кривой нормального распределения, то можно воспользоваться формулой
При помощи этой формулы мы получаем теоретическое (вероятностное) распределение, заменяя им эмпирическое (фактическое) распределение, по характеру они не должны отличаться друг от друга.
Тем не менее в ряде случаев, если вариационный ряд представляет собой распределение по дискретному признаку, где при увеличении значений признака х частоты начинают резко уменьшаться, а средняя арифметическая, в свою очередь, равна или близка по значению к дисперсии (), такой ряд выравнивается по кривой Пуассона.
Кривую Пуассона можно выразить отношением
При выравнивании эмпирических данных теоретические частоты можно определить по формуле
Сравнивая полученные величины теоретических частот f’ c эмпирическими (фактическими) частотами f, убеждаемся, что их расхождения могут быть весьма невелики.
Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.
Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.
Наиболее распространенным является критерий согласия К. Пирсона , который можно представить как сумму отношений квадратов расхождений между f’ и f к теоретическим частотам:
Если , то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.
Если вышеуказанное отношение 3, то расхождения могут быть достаточно существенными и гипотезу о нормальном распределении следует отвергнуть.
Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле
По таблицам значений вероятностей -критерия можно найти величину
, соответствующую вероятности Р. Если величина вероятности Р значительна по отношению к найденной величине
, то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны.
Необходимым условием при использовании критерия согласия Колмогорова является достаточно большое число наблюдений (не меньше ста).
Реферат: работа по статистике на тему: «14. Виды рядов распределения. 24. Мода и медиана.»
Название: работа по статистике на тему: «14. Виды рядов распределения. 24. Мода и медиана.» Раздел: Остальные рефераты Тип: реферат Добавлен 21:58:45 25 сентября 2011 Похожие работы Просмотров: 981 Комментариев: 12 Оценило: 1 человек Средний балл: 2 Оценка: неизвестно Скачать | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Время работы в компании, полных лет (варианты) | Число работающих | |
---|---|---|
Человек (частоты) | в % к итогу (частости) | |
до года | 15 | 11,6 |
1 | 17 | 13,2 |
2 | 19 | 14,7 |
3 | 26 | 20,2 |
4 | 10 | 7,8 |
5 | 18 | 13,9 |
6 | 24 | 18,6 |
Итого | 129 | 100,0 |
Если признак принимает ограниченное число значений, обычно не больше 10, строят дискретные ряды распределения. Если вариант больше, то дискретный ряд теряет свою наглядность; в этом случае целесообразно использовать интервальную форму вариационного ряда. При непрерывной вариации признака, когда его значения в определенных пределах отличаются друг от друга на сколь угодно малую величину, также строят интервальный ряд распределения.
3.3.1. Построение дискретных вариационных рядов
Рассмотрим методику построения дискретных вариационных рядов на примере.
Пример 3.2. Имеются следующие данные о количественном составе 60 семей:
2 3 3 1 4 2 3 3 1 5 2 4 3 2 2 1 2 3 4 5 |
2 2 1 3 4 3 3 3 6 6 3 3 6 1 3 4 3 4 4 5 |
3 3 2 2 1 3 2 5 5 2 4 3 6 1 2 2 3 1 3 4 |
Для того чтобы получить представление о распределении семей по числу их членов, следует построить вариационный ряд. Поскольку признак принимает ограниченное число целых значений строим дискретный вариационный ряд. Для этого сначала рекомендуется выписать все значения признака (число членов в семье) в порядке возрастания (т.е. провести ранжирование статистических данных):
1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 |
2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 |
3 3 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 6 6 6 |
Число членов семьи (х) | Число семей (y) |
---|---|
1 | 8 |
2 | 14 |
3 | 20 |
4 | 9 |
5 | 5 |
6 | 4 |
Итого | 60 |
3.3.2. Построение интервальных вариационных рядов
Покажем методику построения интервальных вариационных рядов распределения на следующем примере.
Пример 3.3. В результате статистического наблюдения получены следующие данные о средней величине процентной ставки 50 коммерческих банков (%):
14,7 | 19,0 | 24,5 | 20,8 | 12,3 | 24,6 | 17,0 | 14,2 | 19,7 | 18,8 |
18,1 | 20,5 | 21,0 | 20,7 | 20,4 | 14,7 | 25,1 | 22,7 | 19,0 | 19,6 |
19,0 | 18,9 | 17,4 | 20,0 | 13,8 | 25,6 | 13,0 | 19,0 | 18,7 | 21,1 |
13,3 | 20,7 | 15,2 | 19,9 | 21,9 | 16,0 | 16,9 | 15,3 | 21,4 | 20,4 |
12,8 | 20,8 | 14,3 | 18,0 | 15,1 | 23,8 | 18,5 | 14,4 | 14,4 | 21,0 |
Как видим, просматривать такой массив данных крайне неудобно, кроме того, не видно закономерностей изменения показателя. Построим интервальный ряд распределения.
Число интервалов на практике часто задается самим исследователем исходя из задач каждого конкретного наблюдения. Вместе с тем его можно вычислить и математически по формуле Стерджесса
Для нашего примера получим: n = 1 + 3,322lgN = 1 + 3,322lg50 = 6,6 » 7.
Для нашего примера
Интервалы вариационного ряда наглядны, если их границы имеют «круглые» значения, поэтому округлим величину интервала 1,9 до 2, а минимальное значение признака 12,3 до 12,0.
Интервалы, как правило, записывают таким образом, чтобы верхняя граница одного интервала являлась одновременно нижней границей следующего интервала. Так, для нашего примера получим: 12,0-14,0; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20,0-22,0; 22,0-24,0; 24,0-26,0.
Подобная запись означает, что признак непрерывный. Если же варианты признака принимают строго определенные значения, например, только целые, но их количество слишком велико для построения дискретного ряда, то можно создать интервальный ряд, где нижняя граница интервала не будет совпадать с верхней границей следующего интервала (это будет означать, что признак дискретный). Например, в распределении работников предприятия по возрасту можно создать следующие интервальные группы лет: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 и более.
Кроме того, в нашем примере мы могли бы сделать первый и последний интервалы открытыми, т.д. записать: до 14,0; 24,0 и выше.
Ставка банка % (варианты) | |||
---|---|---|---|
12,3 | 17,0 | 19,9 | 23,8 |
12,8 | 17,4 | 20,0 | 24,5 |
13,0 | 18,0 | 20,0 | 24,6 |
13,3 | 18,1 | 20,4 | 25,1 |
13,8 | 18,5 | 20,4 | 25,6 |
14,2 | 18,7 | 20,5 | |
14,3 | 18,8 | 20,7 | |
14,4 | 18,9 | 20,7 | |
14,7 | 19,0 | 20,8 | |
14,7 | 19,0 | 21,0 | |
15,1 | 19,0 | 21,0 | |
15,2 | 19,0 | 21,1 | |
15,3 | 19,0 | 21,4 | |
16,0 | 19,6 | 21,9 | |
16,9 | 19,7 | 22,7 |
При подсчете частот может возникнуть ситуация, когда значение признака попадет на границу какого-либо интервала. В таком случае можно руководствоваться правилом: данная единица приписывается к тому интервалу, для которого ее значение является верхней границей. Так, значение 16,0 в нашем примере будет относиться ко второму интервалу.
Результаты группировки, полученные в нашем примере, оформим в таблице.
Краткая ставка, % | Количество банков, ед. (частоты) | Накопленные частоты |
---|---|---|
12,0-14,0 | 5 | 5 |
14,0-16,0 | 9 | 14 |
16,0-18,0 | 4 | 18 |
18,0-20,0 | 15 | 33 |
20,0-22,0 | 11 | 44 |
22,0-24,0 | 2 | 46 |
24,0-26,0 | 4 | 50 |
Итого | 50 | — |
В процессе группировки данных при построении вариационных рядов иногда используются неравные интервалы. Это относится к тем случаям, когда значения признака подчиняются правилу арифметической или геометрической прогрессии или когда применение формулы Стерджесса приводит к появлению «пустых» интервальных групп, не содержащих ни одной единицы наблюдения. Тогда границы интервалов задаются произвольно самим исследователем исходя из здравого смысла и целей обследования либо по формулам. Так, для данных, изменяющихся в арифметической прогрессии, величина интервалов вычисляется следующим образом:
Порядок расчетов границ неравных интервалов для данных, изменяющихся приблизительно в арифметической прогрессии, показан в табл. 3.15.
Для показателей, приблизительно изменяющихся в геометрической прогрессии, величину интервалов можно вычислить по формуле
Для графического изображения интервального ряда используют гистограмму, имеющую вид многоступенчатой фигуры, состоящей из прямоугольников. По оси абсцисс откладывают значения границ интервалов. Сами интервалы будут являться основаниями прямоугольников. Высота прямоугольников соответствует частоте или частости интервалов, которые откладываются по оси ординат.
По данным таблицы, приведенной в примере 3.3, построим гистограмму (рис. 3.2).
При неравных интервалах у гистограммы распределения высотами прямоугольников будут являться показатели плотности распределения, рассчитываемые как частное от деления частоты интервала на его величину.
Зависимость между значениями признака и накопленными частотами показывают особые графики, называемые кумулятой и огивой распределения.
В случае интервального ряда при построении кумуляты по оси абсцисс отмечают границы интервальных групп, накопленные частоты по оси ординат относят к верхним границам интервалов.
По данным таблицы, приведенной в примере 3.3, построим кумуляту распределения для интервального ряда (рис. 3.2).
Если у кумулятивной кривой поменять местами ось абсцисс с осью ординат, получим график, называемый огивой распределения (рис. 3.4).
- network stack driver support в биосе что это такое
- Турецкий футер что за ткань