Новости Словари Конкурсы Бесплатные SMS Знакомства Подари звезду
В нашей
базе уже
59876
рефератов!
Логин

Пароль

Статистический анализ рядов распределения

Статистический анализ рядов распределения.
Статистический анализ рядов распределения



Первая практическая работа по курсу "Общая теория статистики" посвящена теме: "Группировка и статистический анализ распределений". В рамках работы рассматриваются следующие разделы: 1) группировка и построение интервального вариационного ряда распределений; 2) проведение вторичных группировок; 3) способы графического изображения интервальных вариационных рядов распределений; 4) показатели вариации; 5) статистические показатели: - показатели центра распределений (средняя, мода и медиана); - порядковые статистики (квантили); - показатели формы распределений (асимметрия и эксцесс); 6) статистическая проверка гипотез (общие понятия): - построение моделей эмпирических распределений; - выбор аппроксимирующей теоретической кривой; - проверка выдвинутых гипотез с помощью статистического критерия согласия Пирсона (критерий ?2). Выводы. Пример оформления пояснительной записки и выполнения работы в целом. Необходимо дать определения: 1). Группировка. Перечислить, какие задачи решаются с помощью метода группировок (отметить, какую задачу решаем мы); 2). Виды статистических группировок (отметить, какую мы применяем в работе); 3). Группировочный признак (указать, какой признак применяем мы); Исходными данными для выполнения работы являются среднедушевые денежные доходы населения РФ по различным регионам за 1995 г. (даны среднемесячные доходы в денежном выражении - тыс. руб.). Рассматривается 77 регионов. Источник - Российский статистический ежегодник 1999 г. Исходные данные представлены в виде ранжированной по возрастанию числовой статистической совокупности. --------------------------------------------------------------- ( 1) 115.9 (19) 318.8 (37) 371.2 (55) 453.3 (73) 700.8 ( 2) 192.7 (20) 319.1 (38) 372.3 (56) 465 (74) 739.8 ( 3) 232.1 (21) 321.2 (39) 376 (57) 471.5 (75) 949.4 ( 4) 232.3 (22) 324.5 (40) 378.8 (58) 475.6 (76) 956.7 ( 5) 241.3 (23) 325.9 (41) 379.8 (59) 479.3 (77) 961.1 ( 6) 259.2 (24) 330.7 (42) 381.2 (60) 488.6 ( 7) 265.9 (25) 330.9 (43) 382.2 (61) 499.1 ( 8) 274.7 (26) 331.8 (44) 390.8 (62) 503.4 ( 9) 283.5 (27) 333 (45) 391.8 (63) 504.8 (10) 301 (28) 335.3 (46) 393.7 (64) 515.4 (11) 301.5 (29) 339.6 (47) 395.3 (65) 527.8 (12) 306 (30) 340.1 (48) 397.6 (66) 537.6 (13) 307.1 (31) 340.2 (49) 411.2 (67) 579.8 (14) 308.9 (32) 343.3 (50) 415.1 (68) 593.6 (15) 311.6 (33) 343.5 (51) 421.2 (69) 666.4 (16) 314 (34) 348.5 (52) 429.1 (70) 671.8 (17) 314.3 (35) 357.8 (53) 433.9 (71) 672.3 (18) 316.2 (36) 366.3 (54) 435.2 (72) 672.8 --------------------------------------------------------------- Группировка данных и построение интервального вариационного ряда распределения. Для группировки и табулирования совокупности наблюдений1 обычно используется следующая четырехшаговая процедура: 1. На первом шаге рассчитывается вариационный размах (Range), равный разнице между наибольшим и наименьшим значениями ряда распределения. R = 961,1 - 115,9 = 845,2 2. На втором шаге определяется число интервалов и их длина. В пакете STATGRAPHICS реализован следующий алгоритм определения числа интервалов: K1 ? 4.45*ln(n), где n - объем изучаемой статистической совокупности. Другим подходом является метод Sturge's: K2 ? 1+3,322*lg(n). Недостаток метода Sturge's состоит в том, что его применение дает хорошие результаты, если совокупность состоит из большого числа единиц (более 100) и распределение единиц по признаку, положенному в основание группировки, близко к нормальному. При определении числа интервалов K ставится задача построить интервальный вариационный ряд распределения со следующими свойствами: - полученное распределение должно иметь один глобальный максимум (унимодальное распределение); - равномерный характер увеличения значений частот до экстремума (модальное значение) с последующим уменьшением; - отсутствие "пустых" интервалов, т. е. интервалов с нулевым значением частот; - отсутствие так называемых "локальных модальных значений" (рис.1). Если первые два метода не удовлетворяют вышеперечисленным условиям, то число интервалов К определяется путем перебора. Длина интервалов определяется как h = R/К (в случае построения равно-интервальных вариационных рядов распределений) . 3. Границы интервалов определяются следующим образом: Нижняя граница первого интервала l1Н = xmin Верхняя граница первого интервала l1В = l1Н + R/K Нижняя граница i + 1-го интервала li+1Н = liВ Верхняя граница i + 1-го интервала li+1В = liВ + R/K 4. Далее определяются значения частот попадания единиц совокупности в заданные интервалы. Распределение регионов РФ по уровню дохода (число интервалов разбиений К = 19). Frequency Tabulation -------------------------------------------------------------------------------- Lower Upper Relative Cumulative Cum. Rel. Class Limit Limit Midpoint Frequency Frequency Frequency Frequency -------------------------------------------------------------------------------- at or below 115.90 1 .0130 1 .0130 1 115.90 160.38 138.14 0 .0000 1 .0130 2 160.38 204.87 182.63 1 .0130 2 .0260 3 204.87 249.35 227.11 3 .0390 5 .0649 4 249.35 293.84 271.59 4 .0519 9 .1169 5 293.84 338.32 316.08 19 .2468 28 .3636 6 338.32 382.81 360.56 15 .1948 43 .5584 7 382.81 427.29 405.05 8 .1039 51 .6623 8 427.29 471.77 449.53 6 .0779 57 .7403 9 471.77 516.26 494.02 7 .0909 64 .8312 10 516.26 560.74 538.50 2 .0260 66 .8571 11 560.74 605.23 582.98 2 .0260 68 .8831 12 605.23 649.71 627.47 0 .0000 68 .8831 13 649.71 694.19 671.95 4 .0519 72 .9351 14 694.19 738.68 716.44 1 .0130 73 .9481 15 738.68 783.16 760.92 1 .0130 74 .9610 16 783.16 827.65 805.41 0 .0000 74 .9610 17 827.65 872.13 849.89 0 .0000 74 .9610 18 872.13 916.62 894.37 0 .0000 74 .9610 19 916.62 961.10 938.86 3 .0390 77 1.0000 above 961.10 0 .0000 77 1.0000 -------------------------------------------------------------------------------- Mean = 417.805 Standard Deviation = 162.819 Median = 376 В групповую таблицу частот ряда распределения также добавляют расчет центров интервалов распределений, относительные частоты (частости Wi = fi/?fi), накопленные (кумулятивные) частоты (S1= f1, Si = Si-1 + fi), а также накопленные относительные частоты. Графическое изображение интервальных вариационных рядов распределений. Для графического изображения интервальных вариационных рядов применяется гистограмма. На оси 0х откладываются границы интервалов, а на оси 0у значения частот, в виде столбиков. При этом делается допущение, что значение признака в пределах интервалов имеют равномерный характер распределения.
Умар.Ш. был тут !!!!!
 
давайте изгоним мат !!!
 
ДОБРОЙ НОЧИ ОТ Ъ
ЛОКИ ИНО
 
ДМК МЭ
 
где инфааа?