Например, средняя арифметическая для интервального ряда. Середина интервала статистика формула


Решение статистических задач в EXCEL: Практикум, страница 3

Количественные данные следует определить как «Числовые».

2.  Для выполнения расчета необходимо закрыть имеющиеся открытые интервалы – первый – «до 500», последний - «от 700».

    

Формула вычисления левой границы первого интервала вводится в ячейку Z19 : «=АА19-(АА20-Z20)» (– из ячейки АА19 вычесть разницу между содержимым ячейки АА20 и Z20).

Правая граница последнего интервала в ячейку АА23 устанавливается формулой «=Z23+АА22-Z22» (от значения в ячейке Z23 откладывается размер предшествующего интервала «АА22-Z22»).

3.  Рассчитывается среднее по каждой группе , как середина интервала. Для этого в ячейку первой группы (АС19) устанавливается функция СРЗНАЧ(Z19;AA19). После появления среднего значения первого интервала формула копируется в соседние ячейки. При этом автоматически смещаются координаты исходных данных в соответствии со смещением координат ячейки результата.

4.  Рассчитывается величина средней взвешенной (в примере в ячейку АВ25)

СУММПРОИЗВ (АС19:АС23;АВ19:АВ23) реализует числитель

СУММ (АВ19:АВ23) – знаменатель;

 «/» - знак деления.

Дисперсия. Среднее квадратическоеотклонение.

Дисперсия и среднее квадратическое отклонение (СКО) могут вычисляться по простой и взвешенной формулам.

Дисперсия, среднее квадратическое отклонениепо простой форме.

Для расчетов дисперсии по простой форме в Excel используется функция:

ДИСПР (диапазон данных).

СКО определяется как квадратный корень дисперсии, реализуемый оператором возведения в степень «^».

Рассмотрим методику расчета на примере расчета дисперсии и СКО зарплаты подразделения:

1.  Исходные значения признака хi надо записать в массив ячеек расположенных в столбце или строке (в примере в строке (AF42:AQ42)).

Количественные данные следует определить как «Числовые».

2.  В ячейку результата дисперсии (например «AF44») установить функцию ДИСПР(AF42:AQ42)

1.  В ячейку результата СКО (например «AР44») установить функцию (ДИСПР(AF42:AQ42))^0,5.

Знак «^0,5» - означает возведение в степень 0,5 величины стоящей перед ним.

Дисперсия, среднее квадратическоеотклонение по взвешенной форме.

Для расчетов дисперсии по взвешенной форме в Excel используется функция:

СУММ (диапазон данных) и

СУММПРОИЗВ (диапазоны перемножаемых данных),

оператор «/».

СКО определяется как квадратный корень дисперсии, реализуемый оператором возведения в степень «^».

Рассмотрим методику расчета на примере расчета дисперсии и СКО размера семьи группы

1.  Исходные значения признака хi и частоту fi надо записать в массивы ячеек расположенных в столбце или строке (в примере в строках (АТ46:AY46) и (АТ47:AY47).

Количественные данные следует определить как «Числовые».

1.  Рассчитать среднее арифметическое взвешенное - в примере в ячейке AW49 установлена формула =СУММПРОИЗВ (AT46:AY46;AT47:AY47)/СУММ(AT47:AY47)

vunivere.ru

Например, средняя арифметическая для интервального ряда

При расчете средней арифметической для интервального вариационного ряда сначала определяют среднюю для каждого интервала, как полусумму верхней и нижней границ, а затем — среднюю всего ряда. В случае открытых интервалов значение нижнего или верхнего интервала определяется по величине интервалов, примыкающих к ним.

Пример 3. Определить средний возраст студентов вечернего отделения.

Возраст в годах

Число студентов

Среднее значение интервала

Произведение середины интервала (возраст) на число студентов 

до 20

65

(18 + 20) / 2 =19 18 в данном случае граница нижнего интервала. Вычисляется как 20 — (22-20)

1235

20 — 22

125

(20 + 22) / 2 = 21

2625

22 — 26

190

(22 + 26) / 2 = 24

4560

26 — 30

80

(26 + 30) / 2 = 28

2240

30 и более

40

(30 + 34) / 2 = 32

1280

Итого

500

11940

Средние, вычисляемые из интервальных рядов являются приближенными.

  1. Структурные средние величины

Кроме степенных средних в статистике для относительной характеристики величины варьирующего признака и характеристики рядов распределения пользуются структурными средними: модой и медианой.

Мода

Мода— это наиболее часто встречающийся вариант ряда. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей.

Модой для дискретного ряда является варианта, обладающая наибольшей частотой.

При вычислении моды для интервального вариационного ряда необходимо:

  1. сначала определить модальный интервал (по максимальной частоте),

  2. затем — значение модальной величины признака по формуле:

где:

  1. — значение моды

  2. — нижняя граница модального интервала

  3. i — величина интервала

  4. — частота модального интервала

  5. — частота интервала, предшествующего модальному

  6. — частота интервала, следующего за модальным

Определение моды графически: Мода определяется по гистограмме распределения. Для этого

правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника , а левую вершину модального прямоугольника - с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.

Медиана

Медиана — это значение признака, который делит вариационный ряд на две равные по численности части.

Медиана для дискретного ряда.

Для определения медианы в дискретном рядус нечетнымколичеством единиц наблюдения сначалапорядковый номер медианыпо формуле:  , а затем определяют, какое значение варианта обладает накопленной частотой, равной номеру медианы.

Если ряд содержит четное число элементов, то медиана будет равна средней из двух значений признака, находящихся в середине. Номер первого из этих признаков определяется по формуле: , для второго - . = n (количество элементов в ряду).

Медиана для интервального ряда

При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана.

Для этого:

  1. определяется номер медианы по формуле: , полученное значение округляется до целого большего числа.

  2. затем по накопленной частоте определяется интервал, в который входит элемент с таким номером,

  3. затем — значение медианы по формуле:

где:

  • — искомая медиана

  • — нижняя граница интервала, который содержит медиану

  • i   — ширина интервала

  • — сумма частот или число членов ряда

  •  - накопленная частота интервала, предшествующего медианному

  • — частота медианного интервала

Пример. Найти моду и медиану для интервального ряда.

Возрастные группы

Число студентов

Сумма накопленных частот ΣS

До 20 лет

346

346

20 — 25

872

1218

25 — 30

1054

2272

30 — 35

781

3053

35 — 40

212

3265

40 — 45

121

3386

45 лет и более

76

3462

Итого

3462

 

Решение:

  1. Определим моду

В данном примере модальный интервал находится в пределах возрастной группы 25-30 лет, так как на этот интервал приходится наибольшая частота (1054).

Рассчитаем величину моды:

Это значит, что модальный возраст студентов равен 27 годам.

  1. Определим медиану.

Медианный интервал находится в возрастной группе 25-30 лет, так как в пределах этого интервала расположена варианта, которая делит совокупность на две равные части (Σfi/2 = 3462/2 = 1731). Далее подставляем в формулу необходимые числовые данные и получаем значение медианы:

Это значит, что одна половина студентов имеет возраст до 27,4 года, а другая свыше 27,4 года.

Графически медиана определяется по кумуляте. Для ее определения высоту наибольшей ординаты, которая соответствует сумме всех частот, делят пополам. Через полученную точку

проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой.

studfiles.net

STATISTIKA

ВВЕДЕНИЕ

 Средняя величина как категория статистики.  Средние величины являются одними из наиболее распространенных обобщающих статистических показателей. Они имеют своей целью одним числом охарактеризовать статистическую совокупность состоящую из меньшинства единиц. Средние величины тесно связаны с законом больших чисел. Сущность этой зависимости заключается в том, что при большом числе наблюдений случайные отклонения от общей статистики взаимопогашаются и в среднем более отчетливо проявляется статистическая закономерность.  С помощью метода средних решаются следующие основные задачи:  1. Характеристика уровня развития явлений.  2. Сравнение двух или нескольких уровней.  3. Изучение взаимосвязей социально-экономических явлений.  Анализ размещения социально-экономических явлений в пространстве. 

Содержание

I.Статистические показатели: средние величины

1.1.Понятие о средних величинах

1.2.Виды средних и способы их вычисления

II. Основные категории статистики

1. Понятие о средних величинах

Признаки единиц статистических совокупностей различны по своему значению, например, заработная плата рабочих одной профессии какого-либо предприятия не одинакова за один и тот же период времени, различны цены на рынке на одинаковую продукцию, урожайность сельскохозяйственных культур в хозяйствах района и т.д. Поэтому, чтобы определить значение признака, характерное для всей изучаемой совокупности единиц, рассчитывают средние величины.

Средняя величина – это обобщающая характеристика множества индивидуальных значений некоторого количественного признака.

Совокупность, изучаемая по количественному признаку, состоит из индивидуальных значений; на них оказывают влияние, как общие причины, так и индивидуальные условия. В среднем значении отклонения, характерные для индивидуальных значений, погашаются. Средняя, являясь функцией множества индивидуальных значений, представляет одним значением всю совокупность и отражает то общее, что присуще всем ее единицам.

Средняя, рассчитываемая для совокупностей, состоящих из качественно однородных единиц, называется типической средней. Например, можно рассчитать среднемесячную заработную плату работника той или иной профессиональной группы (шахтера, врача библиотекаря). Разумеется, уровни месячной заработной платы шахтеров в силу различия их квалификации, стажа работы, отработанного за месяц времени и многих других факторов отличаются друг от друга, так и от уровня средней заработной платы. Однако в среднем уровне отражены основные факторы, которые влияют на уровень заработной платы, и взаимно погашаются различия, которые возникают вследствие индивидуальных особенностей работника. Средняя заработная плата отражает типичный уровень оплаты труда для данного вида работников. Получению типической средней должен предшествовать анализ того, насколько данная совокупность качественно однородна. Если совокупность состоит их отдельных частей, следует разбить ее на типические группы (средняя температура по больнице).

Средние величины, используемые в качестве характеристик для неоднородных совокупностей, называются системными средними. Например, средняя величина валового внутреннего продукта (ВВП) на душу населения, средняя величина потребления различных групп товаров на человека и другие подобные величины, представляющие обобщающие характеристики государства как единой экономической системы.

Средняя должна вычисляться для совокупностей, состоящих из достаточно большого числа единиц. Соблюдение этого условия необходимо для того, чтобы вошел в силу закон больших чисел, в результате действия которого случайные отклонения индивидуальных величин от общей тенденции взаимно погашаются.

2. Виды средних и способы их вычисления

Выбор вида средней определяется экономическим содержанием определенного показателя и исходных данных. Однако любая средняя величина должна вычисляться так, чтобы при замене ею каждой варианты осредняемого признака не изменился итоговый, обобщающий, или, как его принято называть, определяющий показатель, который связан с осредняемым показателем. Например, при замене фактических скоростей на отдельных отрезках пути их средней скоростью не должно измениться общее расстояние, пройденное транспортным средством за одно и тоже время; при замене фактических заработных плат отдельных работников предприятия средней заработной платой не должен измениться фонд заработной платы. Следовательно, в каждом конкретном случае в зависимости от характера имеющихся данных, существует только одно истинное среднее значение показателя, адекватное свойствам и сущности изучаемого социально-экономического явления.

Наиболее часто применяются средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая и средняя кубическая.

Перечисленные средние относятся к классу степенных средних и объединяются общей формулой:

где – среднее значение исследуемого признака;

m – показатель степени средней;

– текущее значение (варианта) осредняемого признака;

n – число признаков.

В зависимости от значения показателя степени m различают следующие виды степенных средних:

при m = -1 – средняя гармоническая ;

при m = 0 – средняя геометрическая ;

при m = 1 – средняя арифметическая ;

при m = 2 – средняя квадратическая ;

при m = 3 – средняя кубическая .

Средняя арифметическая

Средняя арифметическая применяется, когда объем совокупности представляет собой сумму всех индивидуальных значений варьирующего признака. Следует отметить, что если вид средней величины не указывается, подразумевается средняя арифметическая. Ее логическая формула имеет вид:

Средняя арифметическая простая рассчитывается по несгруппированным данным по формуле:

или ,

где – отдельные значения признака;

j – порядковый номер единицы наблюдения, которая характеризуется значением ;

N – число единиц наблюдения (объем совокупности).

Пример. В лекции «Сводка и группировка статистических данных» рассматривались результаты наблюдения стажа работы бригады из 10 человек. Рассчитаем средний стаж работы рабочих бригады. 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.

По формуле средней арифметической простой вычисляются также средние в хронологическом ряду, если интервалы времени, за которое представлены значения признака, равны.

Пример. Объем реализованной продукции за первый квартал составил 47 ден. ед., за второй 54, за третий 65 и за четвертый 58 ден. ед. Среднеквартальный оборот составляет (47+54+65+58)/4 = 56 ден. ед.

Если в хронологическом ряду приведены моментные показатели, то при вычислении средней они заменяются полусуммами значений на начало и конец периода.

Если моментов больше двух и интервалы между ними равны, то средняя вычисляется по формуле средней хронологической

,

где n- число моментов времени

В случае, когда данные сгруппированы по значениям признака (т. е. построен дискретный вариационный ряд распределения) средняя арифметическая взвешенная рассчитывается с использовании либо частот , либо частостейнаблюдения конкретных значений признака, число которых (k) значительно меньше числа наблюдений (N) .

,

,

где k – количество групп вариационного ряда,

i – номер группы вариационного ряда.

Поскольку , а, получаем формулы, используемые для практических расчетов:

и

Пример. Рассчитаем средний стаж рабочих бригад по сгруппированному ряду.

а) с использованием частот:

б) с использованием частостей:

В случае, когда данные сгруппированы по интервалам, т.е. представлены в виде интервальных рядов распределения, при расчете средней арифметической в качестве значения признака принимают середину интервала, исходя из предположения о равномерном распределении единиц совокупности на данном интервале. Расчет ведется по формулам:

и

где - середина интервала:,

где и– нижняя и верхняя границы интервалов (при условии, что верхняя граница данного интервала совпадает с нижней границей следующего интервала).

Пример. Рассчитаем среднюю арифметическую интервального вариационного ряда, построенного по результатам исследования годовой заработной платы 30 рабочих.

Таблица 1 – Интервальный вариационный ряд распределения.

Интервалы, грн.

Частота, чел.

Частость,

Середина интервала,

600-700

700-800

800-900

900-1000

1000-1100

1100-1200

3

6

8

9

3

1

0,10

0,20

0,267

0,30

0,10

0,033

(600+700):2=650

(700+800):2=750

850

950

1050

1150

1950

4500

6800

8550

3150

1150

65

150

226,95

285

105

37,95

-

26100

869,9

грн. или грн.

Средние арифметические, вычисленные на основе исходных данных и интервальных вариационных рядов, могут не совпадать из-за неравномерности распределения значений признака внутри интервалов. В этом случае для более точного вычисления средней арифметической взвешенной следует использовать не средины интервалов, а средние арифметические простые, рассчитанные для каждой группы (групповые средние). Средняя, вычисленная по групповым средним с использованием взвешенной формулы расчета, называется общей средней.

Средняя арифметическая обладает рядом свойств.

1. Сумма отклонений вариант от средней равна нулю:

.

2. Если все значения вариант увеличиваются или уменьшаются на величину А, то и средняя величина увеличивается или уменьшается на ту же величину А:

3. Если каждую варианту увеличить или уменьшить в В раз, то средняя величина также увеличится или уменьшатся в то же количество раз:

или

4. Сумма произведений вариант на частоты равна произведению средней величины на сумму частот:

5. Если все частоты разделить или умножить на какое-либо число, то средняя арифметическая не изменится:

6) если во всех интервалах частоты равны друг другу, то средняя арифметическая взвешенная равна простой средней арифметической:

,

где k – количество групп вариационного ряда.

Использование свойств средней позволяет упростить ее вычисление.

Допустим, что все варианты (х) сначала уменьшены на одно и то же число А, а затем уменьшены в В раз. Наибольшее упрощение достигается, когда в качестве А выбирается значение середины интервала, обладающего наибольшей частотой, а в качестве В – величина интервала (для рядов с одинаковыми интервалами). Величина А называется началом отсчета, поэтому этот метод вычисления средней называется способом отсчета от условного нуля или способом моментов.

После такого преобразования получим новый вариационный ряд распределения, варианты которого равны . Их средняя арифметическая, называемая моментом первого порядка, выражается формулойи согласно второго и третьего свойств средней арифметической равна средней из первоначальных вариант, уменьшенной сначала на А, а потом в В раз, т. е..

Для получения действительной средней (средней первоначального ряда) нужно момент первого порядка умножить на В и прибавить А:

Расчет средней арифметической по способу моментов иллюстрируется данными табл. 2.

Таблица 2 – Распределение работников цеха предприятия по стажу работы

Стаж работников, лет

Количество работников

Середина интервала

0 – 5

5 – 10

10 – 15

15 – 20

20 – 25

25 – 30

12

16

23

28

17

14

2,5

7,5

12,7

17,5

22,5

27,5

-15

-10

-5

0

5

10

-3

-2

-1

0

1

2

-36

-32

-23

0

17

28

Итого

110

-

-

-

-46

Находим момент первого порядка . Затем, зная, что А=17,5, а В=5, вычисляем средний стаж работы работников цеха:

лет

Средняя гармоническая

Как было показано выше, средняя арифметическая применяется для расчета среднего значения признака в тех случаях, когда известны его варианты x и их частоты f.

Если статистическая информация не содержит частот f по отдельным вариантам x совокупности, а представлена как их произведение , применяется формула средней гармонической взвешенной. Чтобы вычислить среднюю, обозначим , откуда. Подставив эти выражения в формулу средней арифметической взвешенной, получим формулу средней гармонической взвешенной:

,

где - объем (вес) значений признака показателя в интервале с номеромi (i=1,2, …, k).

Таким образом, средняя гармоническая применяется в тех случаях, когда суммированию подлежат не сами варианты, а обратные им величины: .

В тех случаях, когда вес каждой варианты равен единице, т.е. индивидуальные значения обратного признака встречаются по одному разу, применяется средняя гармоническая простая:

,

где – отдельные варианты обратного признака, встречающиеся по одному разу;

N – число вариант.

Если по двум частям совокупности численностью иимеются средние гармонические, то общая средняя по всей совокупности рассчитывается по формуле:

и называется взвешенной гармонической средней из групповых средних.

Пример. В ходе торгов на валютной бирже за первый час работы заключены три сделки. Данные о сумме продажи гривны и курсе гривны по отношению к доллару США приведены в табл. 3 (графы 2 и 3). Определить средний курс гривны по отношению к доллару США за первый час торгов.

Таблица 3 – Данные о ходе торгов на валютной бирже

Номер сделки

Сумма продажи,

млн. грн.,

Курс гривны, грн.,

Частота (количество приобретенных долларов), млн. дол.,

1

2

3

4

1

2

3

45,0

25,2

40,4

5,00

5,04

5,05

9,0

5,0

8,0

Итого

110,6

-

22,0

Средний курс доллара определяется отношением суммы проданных в ходе всех сделок гривен к сумме приобретенных в результате этих же сделок долларов. Итоговая сумма продажи гривны известна из графы 2 таблицы, а количество купленных в каждой сделке долларов определяется делением суммы продажи гривны к ее курсу (графа 4). Всего в ходе трех сделок куплено 22 млн. дол. Значит, средний курс гривны за один доллар составил

.

Полученное значение является реальным, т.к. замена им фактических курсов гривны в сделках не изменит итоговой суммы продаж гривны, выступающей в качестве определяющего показателя: млн. грн.

Если бы для расчета была использована средняя арифметическая, т.е. гривны, то по обменному курсу на покупку 22 млн. дол. нужно было бы затратить 110,66 млн. грн., что не соответствует действительности.

Средняя геометрическая

Средняя геометрическая используется для анализа динамики явлений и позволяет определить средний коэффициент роста. При расчете средней геометрической индивидуальные значения признака представляют собой относительные показатели динамики, построенные в виде цепных величин, как отношения каждого уровня к предыдущему.

Средняя геометрическая простая рассчитывается по формуле:

,

где – знак произведения,

N – число осредняемых величин.

Пример. Количество зарегистрированных преступлений за 4 года возросло в 1,57 раза, в т. ч. за 1-й – в 1,08 раза, за 2-й – в 1,1 раза, за 3-й – в 1,18 и за 4-й – в 1,12 раза. Тогда среднегодовой темп роста количества преступлений составляет: , т.е. число зарегистрированных преступлений ежегодно росло в среднем на 12%.

Средняя геометрическая взвешенная используется, когда временные интервалы неодинаковы:

,

где – временной интервал.

Средняя квадратическая

Средняя квадратическая применяется, когда в качестве вариант используются отклонения фактических значений признака от средней арифметической или от заданной нормы.

Средняя квадратическая простая:

.

Средняя квадратическая взвешенная:

Пример. Вычислить среднюю величину измеренных отклонений фактической длины изделий от заданной нормы.

Отклонения, мм,

Число изделий,

-1,8

-0,8

0,2

1,0

1,4

1

3

4

1

1

3,24

0,64

0,04

1

1,96

3,24

1,92

0,16

1

1,96

0

10

8,28

Для расчета средней квадратической взвешенной определяем и заносим в таблицу и. Тогда средняя величина отклонений длины изделий от заданной нормы равна:

Средняя арифметическая в данном случае была бы непригодна, т.к. в результате мы получили бы нулевое отклонение.

II. Основные категории статистики

Статистика оперирует определенными категориями – понятиями, отражающими существенные, всеобщие свойства и основные отношения явлений действительности.

Объект конкретного статистического исследования называют статистической совокупностью.

Статистическая совокупность – это множество единиц (объектов, явлений), объединённых единой закономерностью и варьирующих в пределах общего качества.

Специфическим свойством статистической совокупности является массовость единиц, поскольку явление характеризуется массовым процессом и всем многообразием определяющих его причин и форм.

Под единицами совокупности понимаются её неделимые первичные элементы, выражающие её качественную однородность, т. е. являющиеся носителями признаков.

Под качественной однородностью единиц совокупности понимается сходство единиц (объектов явлений) по каким-либо существенным признакам, но различающихся по каким-либо другим признакам.

Выделение качественно однородных статистических совокупностей является предпосылкой расчета обобщающих показателей, статистического изучения вариации, связей между признаками.

Единицы статистической совокупности характеризуются общими свойствами, именуемыми в статистике признаками.

Признак – это показатель, характеризующий некоторое свойство объекта совокупности, рассматриваемый, как случайная величина

Значение каждого признака отдельной единицы совокупности (варианты) могут быть различными.

Вариация – это различия в значениях того или иного признака у отдельных единиц, входящих в данную совокупность. Она возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по разному сочетаются в каждом отдельном случае.

Наличие вариации является основной предпосылкой статистического исследования. Варьирующие признаки могут быть количественными , если их варианты выражаются числовыми значениями (возраст, стаж работы, оплата труда и прочее) и неколичественными (атрибутивными), не имеющими числового выражения и представляющими собой смысловые понятия (профессия, социальная принадлежность и т д.)Количественные признаки могут быть дискретными и непрерывными. Случаи, когда варианты признака могут принимать только одно из двух противоположных значений, говорят об альтернативном признаке. Признаки подразделяются на существенные, или главные, выражающие содержательную сторону явлений, и несущественные, или второстепенные, статистическому изучению подлежат существенные признаки.

studfiles.net

Мода и медиана в статистике

Мода и медиана в статистике

В статистике модой называется величина признака (варианта), которая чаще всего встречается в данной совокупности.Медианой в статистике называется варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам. Обозначают медиану символом.

Распределительные средние – мода и медиана, их сущность и способы исчисления.

Данные показатели относятся к группе распределительных средних и используются для формирования обобщающей характеристики величины варьирующего признака.

Мода – это наиболее часто встречающееся значение варьирующего признака в вариационном ряду. Модой распределения называется такая величина изучаемого признака, которая в данной совокупности встречается наиболее часто, т.е. один из вариантов признака повторяется чаще, чем все другие. Для дискретного ряда (ряд, в котором значение варьирующего признака представлены отдельными числовыми показателями) модой является значение варьирующего признака обладающего наибольшей частотой. Для интервального ряда сначала определяется модальный интервал (т.е. содержащий моду), в случае интервального распределения с равными интервалами определяется по наибольшей частоте; с неравными интервалами – по наибольшей плотности, а определение моды требует проведения расчетов на основе следующих формул:

где: - нижняя граница модального интервала;

- величина модального интервала;

- частота модального интервала;

- частота интервала, предшествующего модальному;

- частота интервала, следующего за модальным;

Медиана - это значение варьирующего признака, приходящееся на середину ряда, расположенного в порядке возрастания или убывания числовых значений признака, т.е. величина изучаемого признака, которая находится в середине упорядоченного вариационного ряда. Главное свойство медианы в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины:

Для определения медианы в дискретном ряду при наличии частот, сначала исчисляется полусумма частот, а затем определяется какое значение варьирующего признака ей соответствует. При исчислении медианы интервального ряда сначала определяются медианы интервалов, а затем определяется какое значение варьирующего признака соответствует данной частоте. Для определения величины медианы используется формула:

где: - нижняя граница медианного интервала;

- величина медианного интервала;

- накопленная частота интервала, предшествующего медианному;

- частота медианного интервала;

Медианный интервал не обязательно совпадает с модальным.

Моду и медиану в интервальном ряду распределения можно определить графически. Мода определяется по гистограмме распределения. Для этого выбирается самый высокий прямоугольник, который в данном случае является модальным. Затем правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Далее из точки их пересечения опускают перпендикуляр на ось абсцисс.

Примеры расчета моды и медианы мы уже рассматривали здесь.

www.goodstudents.ru

Алгоритм построения интервального вариационного ряда с равными интервалами

  1. Определяем число интервалов (групп) вариационного ряда

Число групп (интервалов) приближенно определяется по формуле Стерджесса:

m = 1 + 3,322 × lg(n)

где n - общее число единиц наблюдения (общее количество элементов в совокупности и т.д.), lg(n) – десятичный логарифм от n.

Полученную по формуле Стерджесса величину округляют обычно до целого большего числа, поскольку количество групп не может быть дробным числом.

Если ряд интервальный ряд с таким количеством групп по каким-то критериям не устраивает, то можно построить другой интервальный ряд, округлив m до целого меньшего числа и выбрать из двух рядов более подходящий.

Число групп не должно быть больше 15.

Также можно пользоваться следующей таблицей, если совсем нет возможности вычислить десятичный логарифм.

Объем выборки, n

25-40

40-60

60-100

100-200

Больше 200

Число интервалов, m

5-6

6-8

7-10

8-12

10-15

  1. Определяем ширину интервала

Ширина интервала для интервального вариационного ряда с равными интервалами определяется по формуле:

где Xмакс - максимальное из значений xi, Xмин - минимальное из значений xi; m - число групп (интервалов).

Величину интервала (i) обычно округляют до целого числа, исключение составляют лишь случаи, когда изучаются малейшие колебания признака (например, при группировке деталей по величине размера отклонений от номинала, измеряемого в долях миллиметра).

Часто применяется следующее правило:

Количество знаков до запятой

Количество знаков после запятой

Пример ширины интервала по формуле

До какого знака округляем

Пример округленной ширины интервала

0

3

0,375

0,01

0,38

0

2

0,56

0,1

0,6

1

3

4,658

0,01

4,66

1

2

2,54

0,1

2,5

2

любое

12,54

1,0

13

3

любое

672,54

10,00

670

4

любое

3472,45

100,00

3500

и т.д.

  1. Определяем границы интервалов

Нижнюю границу первого интервала принимают равной минимальному значению признака (чаще всего его предварительно округляют до целого меньшего числа с таким же разрядом как ширина интервала). Например, хмин= 15, i=130, хн первого интервала = 10.

хн1 ≈ хмин

Верхняя граница первого интервала соответствует значению (Хmin + i).

Нижняя граница второго интервала всегда равно верхней границе первого интервала. Для последующих групп границы определяются аналогично, т е. последовательно прибавляется величина интервала.

xвi = xнi + i

xнi = xвi-1

  1. Определяем частоты интервалов.

Считаем, сколько значений попало в каждый интервал. При этом помним, что если единица обладает значением признака, равным величине верхней границы интервала, то ее следует относить к следующему интервалу.

  1. Строим интервальный ряд в виде таблицы.

  2. Определяем середины интервалов.

Для дальнейшего анализа интервального ряда понадобится выбрать значение признака для каждого интервала. Это значение признака будет общим для всех единиц наблюдения, попавшим в этот интервал. Т.е. отдельные элементы «теряют» свои индивидуальные значения признака и им присваивается одно общее значение признака. Таким общим значением является середина интервала, которая обозначается x'i .

Рассмотрим на примере с ростом детей, как построить интервальный ряд с равными интервалами.

Имеются первоначальные данные.

 90, 91, 92, 93, 94, 95, 96, 97, 98, 99,  92, 93, 94, 95, 96, 98, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109,  100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 100, 101, 102, 104,  110, 112, 114, 116, 117, 120, 122, 123, 124, 129,  110, 111, 113, 115, 116, 117, 121, 125, 126, 127,  110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129,  111, 113, 116, 127, 123, 122, 130, 131, 132, 133, 134, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 131, 133, 135, 136, 138, 139, 140, 141, 142, 143, 145, 146, 147, 148

studfiles.net

по Статистике 4

I. Общая теория статистики.

Вариант №5

Задание1. Группировка статистических данных.

1.1 По одному группировочному признаку для заданного экономического показателя произвести простую группировку закрытым интервалом.

Величину интервала рассчитать по формуле:

Число групп определяется по формуле:

Таблца1

Группировка предприятий по показателю...закрытым интервалом

1.2 Произвести аналитическую группировку по двум признакам.

Таблица 2

Сложная аналитическая группировка предприятий по двум признакам

1.3 Рассчитать силу связи между признаками для всей совокупности попарно и сделать выводы о характере связей (прямая, обратная).

Сила связи для всей совокупности рассчитывается по формуле:

связь прямая

Силу связи попарно рассчитывается по формуле:

связь прямая

Задание 2. Статистические таблицы и графики

2.1 Построить столбиковую диаграмму для первого показателя для десяти предприятий.

Данные первого показателя Столбиковая диаграмма по первому показателю

2.2 Построить секторную диаграмму для второго показателя для десяти предприятий.

Данные второго показателя Секторная диаграмма по второму показателю

3.2 По двум показателям рассчитать относительные величины интенсивности. Результаты представить в таблице 4.

Таблица 4

Относительная величина интенсивности

Задание 4. Средние величины.

4.1 Рассчитать простую среднюю арифметическую величину по одному показателю:

4.2 Рассчитать среднюю арифметическую взвешенную величину интервального ряда для показателя ,по которому проводилась группировка по формуле:

Таблица 5

Расчёт средней величины интервального ряда

4.3 Рассчитать моду для одного показателя, по которому проводилась группировка.

Формула для расчета:

mirznanii.com

Структурные средние величины

Для характеристики среднего значения признака в вариационном ряду применяются показатели центра распределения: средняя величина , мода и медиана . Средняя величина характеризует типичный уровень признака в совокупности.

Структурные средние (мода, медиана) применяются для изучения внутреннего строения, структуры совокупности. В отличие от средней арифметической, на которую оказывают влияние все значения признака , структурные средние: не зависят от крайних значений признака; выступают как конкретные величины; совпадают с вполне определенными вариантами совокупности. Поэтому, когда для характеристики совокупности расчет средних степенных невозможен, применяются структурные средние величины.

Мода( ) – это значение признака, повторяющееся с наибольшей частотой.

Мода широко используется в коммерческой практике при изучении покупательского спроса, регистрации цен и т.д. Мода обладает определенной устойчивостью к вариации признака. Поэтому ее наиболее удобно применять при изучении рядов с неопределенными границами.

При расчете моды следует учитывать, что она по-разному определяется в дискретных и интервальных вариационных рядах.

В дискретном ряду модой является вариант с наибольшей частотой (частостью).

В интервальном вариационном ряду с равными интервалами для расчета моды сначала определяют модальный интервал (интервал, имеющий наибольшую частоту или частость), а затем применяют формулу:

, где:

нижняя граница модального интервала;

величина модального интервала;

частоты (частости)соответственно модального, предыдущего и последующего интервалов.

В интервальном ряду моду можно определить графически по гистограмме (см. § 3.5).

Для ряда с неравными интервалами модальный интервал определяется по наибольшей плотности распределения или . Это объясняется тем, что моду можно рассматривать как значение признака, которому соответствует максимальная плотность распределения.

Медиана ( )– это значение признака, которое делит единицы ранжированного (упорядоченного) ряда на две равные по объему части.

Таким образом, медианой является значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности: половина единиц совокупности имеют значения признака, меньше, чем медиана, а половина – больше. Медиана используется при статистическом контроле качества продукции, при изучении распределения семей по величине дохода и др.

Ранжированный ряд – это ряд, построенный в порядке возрастания или убывания индивидуальных значений признака. В этой связи можно сказать, что медиана лежит в середине ранжированного ряда и делит его пополам.

Также как и мода, медиана не зависит от крайних значений признака, и поэтому применяется для характеристики центра в ряду распределения с неопределенными границами.

В этой связи медиана является лучшей характеристикой центральной тенденции в следующих случаях:

1) границы крайних интервалов открыты;

2) в ряду имеются чрезмерно большие или малые значения признака;

3) имеют место рез­кие различия между максимальным и минимальным значениями признака.

Из этого следует, что медиана практически выполняет функции средней для неодно­родной совокупности.

Расчет медианы имеет свою специфику. Способ расчета зависит от вида ряда распределения (дискретный или интервальный) и от объема совокупности (четный или нечетный).

Положение медианы в ранжированном ряду определяется ее номером:

, где n – число единиц совокупности. Затем по накопленным частотам определяют ее численное значение.

В дискретном вариационном ряду с нечетным числом единиц ( ) медианной является срединное значение ранжированного ряда.

Пример 5.4.Рассчитать значение медианы по данным о стаже работы 11 –ти сотрудников предприятия: 7, 7, 5, 3, 3, 2, 4, 5, 6, 2, 2 (лет).

Решение. Строим ранжированный ряд:

х1 х2 х3 х4 х5 х6 х7 х8 х9 х10 х11

Число единиц равно 11 (нечетно). Находим номер медианы: = . На шестом месте стоит х6=4, который и является медианной: = 4 года.

В дискретном вариационном ряду с четным числом единиц ( ) медианной также является срединное значение ранжированного ряда. Вначале определяют ее место , а затем - находят как среднюю из двух центральных значений по формуле: .

Пример 5.5.Рассмотрим порядок вычисления медианы в случае четного числа индивидуальных значений.

Допустим, число сотрудников равно не 11, а 12 человек: 7, 7, 5, 3, 3, 2, 4, 5, 6, 2, 2, 6 (лет).

Тогда ранжированный ряд будет выглядеть следующим образом (добавляем одно значение, равное 6):

х1 х2 х3 х4 х5 х6 х7 х8 х9 х10 х11 х12

Порядковый номер медианы:

=

Это означает, что медиана расположена между шестым и седьмым значениями признака в ранжированном ряду, который содержит четное число единиц.

В этом случае медиана равна средней арифметической из соседних значений: 4 и 5.

=

В интервальном вариационном ряду сначала указывают интервал, в котором находится медиана. Медианный интервал – это первый интервал, в котором сумма накопленных частот превысит половину объема совокупности , т.е. > . Для его определения необходимо подсчитать сумму накопленных частот (частостей) до числа, превышающего половину объема совокупности.

Численное значение медианы определяется по формуле:

,

где: нижняя граница медианного интервала;

величина медианного интервала;

- половина объема совокупности;

- сумма накопленных частот, предшествующих медианному интервалу;

- частота медианного интервала.

В интервальном ряду медиану можно определить графически по кумуляте (см. § 3.5).

Пример 5.6.По данным табл. 3.4. рассчитать средний стаж работы 20-ти сотрудников туристского предприятия, моду и медиану распределения (табл. 5.3).

Решение. Ряд распределения является интервальным. Поэтому переходят к серединам соответствующих интервалов:

Таблица 5.3

Распределение сотрудников туристского предприятия по стажу работы

Стаж работы, лет (хi) Количество сотрудников, чел. (fi) Середин интервала, хi Накопленная частота, Fi
- 3 1,5 6,0
3 – 6 4,5 27,0
6 – 9 7,5 60,0
9 – 12 10,5 10.5
12 - 13,5 13,5
Итого - 117,0 -

Cредняя арифметическая = лет.

Для нахождения моды сначала определяется модальный интервал: , следовательно, модальным является интервал от 6 до 9 лет.

;

лет - наиболее часто встречающийся стаж сотрудников.

При нахождении медианы сначала определяют накопленную частоту каждого последующего интервала до тех пор, пока она не превысит 1/2 суммы накопленных частот > =10.

В нашем случае медианным является интервал с границами 6-9.

Теперь рассчитаем медиану:

лет – половина сотрудников имеет стаж до 6 лет, а половина – более 6 лет.

Следует заметить, что расчет модального и медианного значений для вариационных рядов с неравными интервалами осуществляется по аналогичным формулам. Для сопоставимости неравных интервалов вместо показателей частот (частостей) используются показатели абсолютной и относительной плотности распределения.

Медиана находит свое практическое применение вследствие особого свойства – сумма абсолютных отклонений членов ряда от медианы есть величина наименьшая, т.е. Это свойство медианы находит широкое применение в маркетинговой деятельности.

Таким образом, в соответствии с вышеизложенным, приходим к выводу:

§ средняя арифметическая - часто используется в качестве показателя центра распре­деления, положительные и отрицательные отклонения от которого индивидуальных значений признака в сумме взаимно погашаются;

§ мода М0 - это величина, вокруг которой группируется наибольшее количество единиц сово­купности.

§ медиана Ме- отражает значение признака, сумма отклонений от кото­рого является наименьшей величиной.

Соотношение моды М0, медианы Ме и средней арифметической указы­вает на характер распределения признака в совокупности, позволяет судить о симметричности эмпи­рического ряда распределения.

Рассмотрим возможные случаи соотношения моды, медианы и средней величины, определяющие характер распределения:

1. х = Me = Mo - симметричное рас­пределение;

2. < Ме < Мо- ле­восторонняя асимметрия;

3. Мо < Ме < - правосторонняя асимметрия.

Симметричное распределение –это распределе­ние, в котором частоты двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой.

При левосторонней асиммет­рии большая часть единиц совокупности имеет значе­ния признака ниже модального. На графике распределения левая ветвь вытянута больше, чем правая.

При правостороннейасиммет­рии большая часть единиц совокупности имеет значения изучаемого признака, превышающие модальное значение. На графике распреде­ления правая ветвь относительно максимальной ординаты вытянута больше, чем левая.

Нашему примеру соответствует соотношение < Ме < Мо (5, 9 лет < 6 лет < 6,7 лет), характерное для левосторонней асим­метрии, что подтверждается графиком - гистограммой (рис. 3.3). Наличие левосторонней асиммет­рии свидетельствует о том, что большая часть сотрудников имеет стаж работы меньше, чем его модальное значение (8 лет).

Чем больше расхождение между средней арифметической и модой, тем более асимметричен ряд. Для умеренно ассиметричных рядов разность между модой и средней примерно в три раза превышает разность между медианой и средней:

.

В нашем случае, что свидетельствует о сильной асимметрии.

При анализе вариационного ряда важно знать не только направ­ление асимметрии (правосторонняя или левосторонняя), но и ее сте­пень, которая измеряется с помощью коэффициента асимметрии.

 

Контрольные вопросы

1. Дайте определение средней величины.

2. Каково значение средних величин в статистике?

3. Перечислите условия и задачи применения средних величин.

4. Назовите категории средних величин.

5. В чем состоит отличие простой средней от взвешенной?

6. Приведите формулы расчета степенных средних величин.

7. Сформулируйте правило мажорантности средних.

8. В чем состоит особенность расчета средних величин в интервальных рядах?

9. Назовите сферу применения степенных средних величин.

10. Перечислите свойства средней арифметической величины.

11. В чем состоит применение метода моментов при расчете средних величин?

12. Дайте определение и назовите сферу применения структурных средних величин.

13. В чем состоит специфика расчета структурных средних величин в дискретных и интервальных рядах распределения?

14. Перечислите возможные случаи соотношения моды, медианы и средней величины, определяющие характер распределения.

 



infopedia.su