Какво се нарича опции? Вариационни серии

Наборът от стойности на параметъра, изследван в даден експеримент или наблюдение, класиран по стойност (увеличаване или намаляване), се нарича вариационна серия.

Да предположим, че измерихме артериално наляганепри десет пациенти, за да се получи горен праг на кръвното налягане: систолно налягане, т.е. само едно число.

Нека си представим, че серия от наблюдения (статистически набор) на артериалното систолно налягане в 10 наблюдения има следващ изглед(Маса 1):

маса 1

Компонентите на една вариационна серия се наричат ​​варианти. Опциите представляват числената стойност на изследваната характеристика.

Строителство от статистическа съвкупностнаблюденията на вариационна серия е само първата стъпка към разбирането на характеристиките на цялата популация. След това трябва да определите средно нивоизследваната количествена характеристика (средно ниво на протеин в кръвта, средно тегло на пациентите, средно време на начало на анестезията и др.)

Средното ниво се измерва с помощта на критерии, наречени средни стойности. Средната стойност е обобщаваща числена характеристика на качествено еднородни величини, характеризираща с едно число цялата статистическа съвкупност по един критерий. Средната стойност изразява това, което е общо за дадена характеристика в даден набор от наблюдения.

Има три типа средни стойности, които се използват често: режим (), медиана () и средна стойност. аритметично количество ().

За да се определи всяка средна стойност, е необходимо да се използват резултатите от индивидуалните наблюдения, като се записват под формата на вариационна серия (Таблица 2).

Мода- стойността, която се среща най-често в серия от наблюдения. В нашия пример режим = 120. Ако няма повтарящи се стойности в серията вариации, тогава те казват, че няма режим. Ако няколко стойности се повтарят еднакъв брой пъти, тогава най-малката от тях се приема като режим.

Медиана- стойност, разделяща разпределението на две равни части, централната или средната стойност на поредица от наблюдения, подредени във възходящ или низходящ ред. Така че, ако има 5 стойности във вариационна серия, тогава нейната медиана е равна на третия член на вариационната серия, ако има четен брой членове в серията, тогава медианата е средната аритметична от двете централни наблюдения, т.е. ако има 10 наблюдения в серия, тогава медианата е равна на средноаритметичната стойност на 5-то и 6-то наблюдение. В нашия пример.

Забележка важна характеристикарежими и медиани: техните стойности не са засегнати числови стойностиекстремен вариант.

Средноаритметичноизчислено по формулата:

където е наблюдаваната стойност в -тото наблюдение и е броят на наблюденията. За нашия случай.

Средната аритметична има три свойства:

Средната стойност заема средна позиция във вариационната серия. В строго симетричен ред.

Средната стойност е обобщаваща стойност и случайните колебания и разликите в отделните данни не се виждат зад средната стойност. Той отразява характерното за цялото население.

Сумата от отклоненията на всички опции от средната е нула: . Посочено е отклонението на опцията от средното.

Серията вариации се състои от варианти и съответните им честоти. От десетте получени стойности числото 120 се среща 6 пъти, 115 - 3 пъти, 125 - 1 път. Честота () - абсолютният брой отделни варианти в съвкупността, показващ колко пъти се среща тази опциявъв вариационната серия.

Вариационните серии могат да бъдат прости (честоти = 1) или групирани и съкратени, с опции 3-5. Проста серия се използва, когато има малък брой наблюдения (), групирани - когато голямо числонаблюдения().

В резултат на усвояването на тази глава студентът трябва: зная

  • показатели за вариация и тяхната връзка;
  • основни закони на разпределение на характеристиките;
  • същността на критериите за съгласие; да бъде в състояние да
  • изчислява индекси на вариация и критерии за съответствие;
  • определят характеристиките на разпространението;
  • оценете основното числови характеристикистатистически серии на разпределение;

собствен

Вариационни индикатори

При статистически изследванияхарактеристики на различни статистически агрегати, изследване на вариациите в характеристиките на индивида статистически единицисъвкупност, както и характера на разпределението на единиците на тази основа. вариация -това са разлики в индивидуалните стойности на дадена характеристика сред изследваните единици от популацията. Изследването на вариацията има голямо значение практическо значение. По степента на вариация може да се съди за границите на вариация на характеристика, хомогенността на популацията за дадена характеристика, типичността на средната стойност и връзката на факторите, които определят вариацията. Индикаторите за вариация се използват за характеризиране и организиране на статистически съвкупности.

Резултати от обобщаване и групиране на материали статистическо наблюдение, проектирани под формата на статистически серии за разпределение, представляват подредено разпределение на единиците от изследваната съвкупност в групи според групиращи (променливи) характеристики. Ако за основа на групирането се вземе качествена характеристика, тогава се нарича такава серия на разпределение атрибутивни(разпределение по професия, пол, цвят и др.). Ако серия за разпределение е изградена на количествена основа, тогава такава серия се нарича вариационен(разпределение по ръст, тегло, размер заплатии т.н.). Да се ​​конструира вариационна серия означава да се организира количественото разпределение на единиците на популацията по характерни стойности, да се преброи броя на единиците на популацията с тези стойности (честота) и да се подредят резултатите в таблица.

Вместо честота на даден вариант е възможно да се използва съотношението му към общия обем на наблюденията, което се нарича честота (относителна честота).

Има два вида вариационни серии: дискретни и интервални. Дискретна серия- Това е вариационна серия, чието конструиране се основава на характеристики с прекъсната промяна (дискретни характеристики). Последните включват броя на служителите в предприятието, тарифната категория, броя на децата в семейството и др. Серия от дискретни вариации представлява таблица, която се състои от две колони. Първата колона показва конкретно значениехарактеристика, а във втория - броят на единиците от съвкупността със определена стойностзнак. Ако една характеристика има непрекъсната промяна (размер на дохода, трудов стаж, цена на дълготрайните активи на предприятието и т.н., които в определени граници могат да приемат всякакви стойности), тогава за тази характеристика е възможно да се конструира интервални вариационни серии.Когато се конструира интервална вариационна серия, таблицата също има две колони. Първият показва стойността на атрибута в интервала „от - до“ (опции), вторият показва броя на единиците, включени в интервала (честота). Честота (честота на повторение) - броят на повторенията на определен вариант на стойностите на атрибута. Интервалите могат да бъдат затворени или отворени. Затворените интервали са ограничени от двете страни, т.е. имат както долна („от“), така и горна („до“) граница. Отворени интервалиимат една граница: горна или долна. Ако опциите са подредени във възходящ или низходящ ред, тогава се извикват редовете класиран.

За вариационни серии има два вида опции честотни характеристики: натрупана честота и натрупана честота. Натрупаната честота показва при колко наблюдения стойността на характеристиката е взела стойности, по-малки от дадена стойност. Натрупаната честота се определя чрез сумиране на честотните стойности на характеристика за дадена група с всички честоти на предишни групи. Натрупаната честота характеризира специфично теглоединици за наблюдение, в които характерните стойности не надвишават горната граница на групата данни. По този начин натрупаната честота показва съотношението на опциите в съвкупността, които имат стойност не по-голяма от дадената. Честота, честота, абсолютна и относителна плътност, натрупана честота и честота са характеристики на величината на варианта.

Вариациите в характеристиките на статистическите единици на съвкупността, както и естеството на разпределението, се изучават с помощта на показатели и характеристики на вариационните серии, които включват средното ниво на серията, средното линейно отклонение, стандартното отклонение, дисперсията , коефициенти на трептене, вариация, асиметрия, ексцес и др.

Средните стойности се използват за характеризиране на разпределителния център. Средната стойност е обобщаваща статистическа характеристика, в която получава количествен изразтипичното ниво на черта, притежавана от членовете на изследваната популация. Възможно е обаче да има случаи, когато средните аритметични стойности съвпадат различен характерразпространение, следователно като статистически характеристикивариационни редове се изчисляват т. нар. структурни средни - мода, медиана, както и квантили, които разделят реда на разпределение на равни части (квартили, децили, персентили и др.).

мода -Това е стойността на характеристика, която се среща в серията на разпределение по-често от другите й стойности. За дискретни серии това е опцията с най-висока честота. При интервалните вариационни серии, за да се определи модата, е необходимо първо да се определи интервалът, в който се намира, т. нар. модален интервал. В вариационна серия с равни интервали, модалният интервал се определя от най-високата честота, в серия с неравни интервали - но най-висока плътностразпределения. След това формулата се използва за определяне на режима в редове на равни интервали

където Mo е модната стойност; xMo - долна граница на модалния интервал; ч-ширина на модалния интервал; / Mo - честота на модалния интервал; / Mo j е честотата на премодалния интервал; / Mo+1 е честотата на постмодалния интервал и за серия с неравни интервали в тази формула за изчисление, вместо честотите / Mo, / Mo, / Mo, трябва да се използват плътности на разпределение Ум 0 _| , Ум 0> UMO+"

Ако има единичен режим, тогава вероятностното разпределение на случайната променлива се нарича унимодално; ако има повече от един режим, той се нарича многомодален (многомодален, мултимодален), при два режима - бимодален. По правило мултимодалността показва, че изследваното разпределение не се подчинява на закона нормална дистрибуция. Хомогенните популации, като правило, се характеризират с едновърхови разпределения. Multivertex също показва хетерогенността на изследваната популация. Появата на два или повече върха налага прегрупирането на данните, за да се идентифицират по-хомогенни групи.

В серия от интервални вариации режимът може да се определи графично с помощта на хистограма. За да направите това, начертайте две пресичащи се линии от горните точки на най-високата колона на хистограмата до горните точки на две съседни колони. След това от точката на тяхното пресичане се спуска перпендикуляр върху абсцисната ос. Стойността на характеристиката по оста x, съответстваща на перпендикуляра, е режимът. В много случаи, когато се характеризира съвкупността като обобщен показател, се дава предпочитание на модата, а не на средното аритметично.

Медиана -Това централно значениехарактеристика, тя се притежава от централния член на класираната серия на разпространение. IN дискретна серияЗа да се намери стойността на медианата, първо се определя нейният пореден номер. За да направите това, ако не четен бройединици, едно се добавя към сумата от всички честоти, числото се дели на две. Ако има четен брой единици в един ред, ще има две медианни единици, така че в този случай медианата се определя като средната стойност на стойностите на двете медианни единици. По този начин медианата в серия от дискретни вариации е стойността, която разделя серията на две части, съдържащи същия номернастроики.

В интервални серии, след определяне на поредния номер на медианата, медиалният интервал се намира с помощта на натрупаните честоти (честоти) и след това с помощта на формулата за изчисляване на медианата се определя стойността на самата медиана:

където Me е средната стойност; x Аз -долна граница на средния интервал; ч-ширина на средния интервал; - сумата от честотите на серията на разпределение; /D - натрупаната честота на предмедианния интервал; / Me - честота на медианния интервал.

Медианата може да се намери графично с помощта на кумулация. За да направите това, по скалата на натрупаните честоти (честоти), се натрупва от точката, съответстваща на сериен номермедиана, начертана е права линия успоредна на остаабсцисата, докато се пресече с кумулата. След това от точката на пресичане на посочената линия с кумулата се спуска перпендикуляр към абсцисната ос. Стойността на атрибута по оста x, съответстваща на начертаната ордината (перпендикуляр), е медианата.

Медианата се характеризира със следните свойства.

  • 1. Не зависи от онези стойности на атрибута, които се намират от двете му страни.
  • 2. Има свойството минималност, което означава, че сумата от абсолютните отклонения на стойностите на атрибута от медианата представлява минимална стойност в сравнение с отклонението на стойностите на атрибута от всяка друга стойност.
  • 3. При комбиниране на две разпределения с известни медиани е невъзможно да се предвиди предварително стойността на медианата на новото разпределение.

Тези свойства на медианата се използват широко при проектиране на местоположения на точки. опашка- училища, клиники, бензиностанции, водовземни колони и др. Например, ако се планира изграждането на клиника в определен блок на града, тогава би било по-целесъобразно тя да бъде разположена в точка от блока, която намалява наполовина не дължината на блока, а броя на жителите.

Съотношението на режима, медианата и средната аритметична показва естеството на разпределението на характеристиката в съвкупността и ни позволява да оценим симетрията на разпределението. Ако x Me тогава има дясностранна асиметрия на серията. С нормално разпределение Х -Аз - Мо.

Подравняване на базата на K. Pearson различни видовекривите определят, че за умерено асиметрични разпределения са валидни следните приблизителни зависимости между средната аритметична стойност, медианата и модата:

където Me е средната стойност; Мо - значение на модата; x arithm - стойността на средноаритметичното.

Ако има нужда да се проучи по-подробно структурата на вариационната серия, тогава се изчисляват характерни стойности, подобни на медианата. Такива характерни стойности разделят всички единици на разпределение на равни числа; Квантилите са разделени на квартили, децили, процентили и т.н.

Квартилите разделят населението на четири равни части. Първият квартил се изчислява подобно на медианата, като се използва формулата за изчисляване на първия квартил, като предварително се определи първият тримесечен интервал:

където Qi е стойността на първия квартил; xQ^-долна граница на първия квартилен диапазон; ч- ширина на интервала на първата четвърт; /, - честоти на интервалните серии;

Кумулативна честота в интервала, предхождащ първия квартилен интервал; Jq ( - честота на първия квартилен интервал.

Първият квартил показва, че 25% от единиците на съвкупността са по-малки от неговата стойност, а 75% са повече. Вторият квартил е равен на медианата, т.е. Q 2 =аз

По аналогия, третият квартил се изчислява, като първо се намери третият тримесечен интервал:

където е долната граница на диапазона на третия квартил; ч- ширина на третия квартилен интервал; /, - честоти на интервалните серии; /Х" -натрупана честота в предходния интервал

Ж

трети квартилен интервал; Jq е честотата на третия квартилен интервал.

Третият квартил показва, че 75% от единиците на съвкупността са по-малки от неговата стойност, а 25% са повече.

Разликата между третия и първия квартил е интерквартилният диапазон:

където Aq е стойността на интерквартилния диапазон; Q 3 -стойност на третия квартил; Q е стойността на първия квартил.

Децилите разделят населението на 10 равни части. Децил е стойност на характеристика в серия на разпределение, която съответства на десети от размера на популацията. По аналогия с квартилите, първият децил показва, че 10% от единиците на съвкупността са по-малки от неговата стойност, а 90% са по-големи, а деветият децил разкрива, че 90% от единиците на съвкупността са по-малки от неговата стойност, а 10% са по-голяма. Съотношението на деветия и първия децил, т.е. Децилният коефициент се използва широко в изследването на диференциацията на доходите за измерване на съотношението на нивата на доходите на 10% от най-заможното и 10% от най-малко заможното население. Процентилите разделят класираната популация на 100 равни части. Изчисляването, значението и приложението на процентилите са подобни на децилите.

Квартили, децили и други структурни характеристикиможе да се определи графично по аналогия с медианата, използвайки кумулати.

За измерване на размера на вариацията се използват следните показатели: диапазон на вариация, средно линейно отклонение, стандартно отклонение, дисперсия. Големината на диапазона на вариация зависи изцяло от случайността на разпределението на екстремните членове на серията. Този индикатор представлява интерес в случаите, когато е важно да се знае каква е амплитудата на колебанията в стойностите на дадена характеристика:

Където Р-стойността на диапазона на вариация; х тах - максимална стойностзнак; x tt - минимална стойностзнак.

При изчисляване на диапазона на вариация стойността на по-голямата част от членовете на серията не се взема предвид, докато вариацията се свързва с всяка стойност на члена на серията. Индикаторите, които са средни стойности, получени от отклонения на отделни стойности на характеристика от тяхната средна стойност, нямат този недостатък: средното линейно отклонение и стандартното отклонение. Съществува пряка връзка между индивидуалните отклонения от средните стойности и изменчивостта на определен признак. Колкото по-силна е флуктуацията, толкова по-голям е абсолютният размер на отклоненията от средната стойност.

Средното линейно отклонение е средноаритметичната стойност на абсолютните стойности на отклоненията на отделните опции от тяхната средна стойност.

Средно линейно отклонение за негрупирани данни

където /pr е средната стойност линейно отклонение; x, - е стойността на атрибута; Х - П -брой единици в популацията.

Средно линейно отклонение на групираните серии

където / vz - стойността на средното линейно отклонение; x, е стойността на атрибута; Х -средната стойност на признака за изследваната популация; / - броят на единиците съвкупност в отделна група.

Признаци на отклонения в в такъв случайсе игнорират в в противен случайсумата от всички отклонения ще бъде равна на нула. Средното линейно отклонение в зависимост от групирането на анализираните данни се изчислява по различни формули: За групирани и негрупирани данни. Средното линейно отклонение, поради своята условност, отделно от другите показатели за вариация, се използва на практика сравнително рядко (по-специално за характеризиране на изпълнението на договорните задължения за равномерност на доставката; в анализа на оборота външната търговия, състав на работниците, ритъм на производство, качество на продукта, като се вземат предвид технологичните характеристики на производството и др.).

Стандартното отклонение характеризира колко е средното отклонение индивидуални ценностина изследвания признак от средната стойност на съвкупността, и се изразява в мерни единици на изследвания признак. Стандартното отклонение, като една от основните мерки за вариация, се използва широко при оценка на границите на вариация на характеристика в хомогенна съвкупност, при определяне на ординатните стойности на крива на нормално разпределение, както и при изчисления, свързани с организацията пробно наблюдениеи установяване на точност характеристики на извадката. Стандартното отклонение на негрупираните данни се изчислява с помощта на следния алгоритъм: всяко отклонение от средната стойност се повдига на квадрат, всички квадрати се сумират, след което сумата от квадратите се разделя на броя на членовете на серията и квадратният корен се извлича от коефициент:

където Iip е средната стойност квадратно отклонение; Xj-стойност на атрибута; х- средната стойност на признака за изследваната популация; П -брой единици в популацията.

За групирани анализирани данни стандартното отклонение на данните се изчислява с помощта на претеглената формула

Където - стойност на стандартното отклонение; Xj-стойност на атрибута; Х -средната стойност на признака за изследваната популация; f x -броя на единиците от населението в определена група.

Изразът под корена и в двата случая се нарича дисперсия. По този начин дисперсията се изчислява като средния квадрат на отклоненията на стойностите на атрибутите от тяхната средна стойност. За непретеглени (прости) стойности на атрибута дисперсията се определя, както следва:

За претеглени характерни стойности

Съществува и специален опростен метод за изчисляване на дисперсията: общо

за непретеглени (прости) характеристични стойности за претеглени характеристични стойности
използвайки нулевия метод

където a 2 е стойността на дисперсията; x, - е стойността на атрибута; Х -средна стойност на характеристиката, ч-стойност на групов интервал, t 1 -тегло (A =

Дисперсията има свой собствен израз в статистиката и е един от най-важните показатели за вариация. Измерва се в единици, съответстващи на квадрата на мерните единици на изследваната характеристика.

Дисперсията има следните свойства.

  • 1. Дисперсия постоянна стойностравен на нула.
  • 2. Намаляването на всички стойности на характеристика със същата стойност А не променя стойността на дисперсията. Това означава, че средният квадрат на отклоненията не може да се изчисли по дадени стойностизнак, а по техните отклонения от някакво постоянно число.
  • 3. Намаляване на всякакви характерни стойности в кпъти намалява дисперсията с к 2 пъти и стандартното отклонение е вътре кпъти, т.е. всички стойности на атрибути могат да бъдат разделени на някои постоянно число(да речем по стойността на интервала на серията), изчислете стандартното отклонение и след това го умножете по постоянно число.
  • 4. Ако изчислим средния квадрат на отклоненията от всяка стойност Иразличаваща се в една или друга степен от средноаритметичната стойност, тогава тя винаги ще бъде по-голяма от средния квадрат на отклоненията, изчислени от средната аритметична стойност. Среден квадратв този случай ще има повече отклонения със съвсем определено количество - с квадрата на разликата между средната и тази условно взета стойност.

Вариацията на алтернативна характеристика се състои в наличието или отсъствието на изследваното свойство в единици от съвкупността. Количествено, вариацията на алтернативен признак се изразява с две стойности: наличието на единица от изследваното свойство се означава с единица (1), а липсата му се означава с нула (0). Делът на единиците, които притежават изследваното свойство, се означава с P, а делът на единиците, които нямат това свойство, се означава с Ж.По този начин дисперсията на алтернативен атрибут е равна на произведението от дела на единиците, притежаващи това свойство (P) от дела на единиците, които не притежават това свойство (G).Най-голяма вариация на съвкупността се постига в случаите, когато част от популацията, съставляваща 50% от общия обем на популацията, има характеристика, а друга част от популацията, също равна на 50%, не притежава тази характеристика, и дисперсията достига максимална стойност от 0,25, т.е. P = 0,5, G= 1 - P = 1 - 0,5 = 0,5 и o 2 = 0,5 0,5 = 0,25. Долната граница на този показател е нула, което съответства на ситуация, при която няма промяна в съвкупността. Практическа употребавариация на алтернативна характеристика се състои в конструиране доверителни интервалипри провеждане на пробно наблюдение.

как по-малка стойностдисперсия и стандартно отклонение, толкова по-хомогенна е популацията и по-типична ще бъде средната стойност. В практиката на статистиката често има нужда от сравняване на вариации различни знаци. Например, интересно е да се сравнят вариациите във възрастта на работниците и тяхната квалификация, трудовия стаж и заплатите, разходите и печалбата, трудовия стаж и производителността на труда и др. За такива сравнения показателите за абсолютна променливост на характеристиките са неподходящи: невъзможно е да се сравни променливостта на трудовия опит, изразена в години, с промяната на заплатите, изразена в рубли. За извършване на такива сравнения, както и сравнения на променливостта на една и съща характеристика в няколко популации с различни средни аритметични стойности, се използват показатели за вариация - коефициентът на колебание, линеен коефициентвариации и коефициент на вариация, които показват степента, в която екстремните стойности варират около средните.

Коефициент на трептене:

Където V R -стойност на коефициента на трептене; Р- стойност на диапазона на вариация; Х -

Линеен коефициент на вариация".

Където Vj-стойността на линейния коефициент на вариация; аз -стойността на средното линейно отклонение; Х -средната стойност на характеристиката за изследваната популация.

Коефициентът на вариация:

Където V a -стойност на коефициента на вариация; a е стойността на стандартното отклонение; Х -средната стойност на характеристиката за изследваната популация.

Коефициентът на трептене е процентдиапазонът на вариация спрямо средната стойност на изследваната характеристика, а линейният коефициент на вариация е отношението на средното линейно отклонение към средната стойност на изследваната характеристика, изразено като процент. Коефициентът на вариация е процентът на стандартното отклонение спрямо средната стойност на изследваната характеристика. Като относителна стойност, изразена в проценти, коефициентът на вариация се използва за сравняване на степента на вариация на различни характеристики. С помощта на коефициента на вариация се оценява хомогенността на статистическата съвкупност. Ако коефициентът на вариация е по-малък от 33%, тогава изследваната популация е хомогенна и вариацията е слаба. Ако коефициентът на вариация е повече от 33%, тогава изследваната популация е хетерогенна, вариацията е силна, а средната стойност е нетипична и не може да се използва като общ индикатор за тази популация. В допълнение, коефициентите на вариация се използват за сравняване на променливостта на един признак в различни популации. Например, за да се оцени разликата в трудовия стаж на работниците в две предприятия. как повече стойносткоефициент, толкова по-значима е вариацията на характеристиката.

Въз основа на изчислените квартили също е възможно да се изчисли относителният показател на тримесечната вариация, като се използва формулата

където Q 2 И

Интерквартилният диапазон се определя по формулата

Квартилното отклонение се използва вместо диапазона на вариация, за да се избегнат недостатъците, свързани с използването на екстремни стойности:

За серия с неравномерни интервали на вариации се изчислява и плътността на разпределението. Дефинира се като частното на съответната честота или честота, разделено на стойността на интервала. При сериите с неравни интервали се използват абсолютни и относителни плътности на разпределение. Абсолютна плътностразпределението е честотата на единица дължина на интервала. Относителна плътност на разпределение - честота на единица дължина на интервала.

Всичко по-горе е вярно за сериите на разпределение, чийто закон за разпределение е добре описан нормален законразпространение или близо до него.

Статистическите серии за разпределение са най-простата формагрупи.

Статистически редове на разпределение- това е подредено количествено разпределение на единиците на съвкупността на хомогенни групина различна (атрибутивна или количествена) основа.

В зависимост от знака,в основата на формирането на групи се прави разлика между атрибутивни и вариационни серии на разпределение.

Атрибутивен се наричат ​​серии на разпределение, изградени според качествени характеристики, т.е. знаци, които нямат числено изражение. Пример за серия за разпределение на признаци е разпределението на икономически активното население на Руската федерация по пол през 2010 г. (Таблица 3.10).

Таблица 3.10. Разпределение на икономически активното население на Руската федерация по пол през 2010 г

Вариационен се наричат ​​серии на разпределение, построени по количествена характеристика, т.е. знак, който има числов израз.

Вариационният ред на разпределение се състои от два елемента: опции и честоти.

Настроики наименувайте индивидуалните стойности на характеристика, която приема в серия от вариации.

Честоти са номерата на отделните варианти или всяка група от вариационната серия. Честотите показват колко често се срещат определени стойности на дадена характеристика в изследваната популация. Сумата от всички честоти определя размера на цялата популация, нейния обем.

Честоти се наричат ​​честоти, изразени в части от единица или като процент от общата сума. Съответно сумата от честотите е равна на 1 или 100%.

В зависимост от характера на изменението на признакаправи разлика между дискретни и интервални вариационни серии на разпределение.

Разпределение на дискретни вариационни серии - Това е серия на разпределение, в която групите са съставени според характеристика, която се променя прекъснато, т.е. през определен бройединици и приема само цели числа. Например разпределението на броя на построените апартаменти Руска федерацияпо броя на стаите в тях I! 2010 (Таблица 3.11).

Таблица 3.11. Разпределение на броя на построените апартаменти в Руската федерация по броя на стаите в тях през 2010 г.

Разпределение на интервални вариационни серии - Това е серия на разпределение, в която характеристиката на групиране, която формира основата на групирането, може да приема всякакви стойности в интервала, които се различават една от друга с произволно малка сума.

Изграждането на интервални вариационни серии е препоръчително предимно за непрекъсната вариация на характеристика (Таблица 3.12), както и ако дискретна вариация на характеристика се проявява в широк диапазон (Таблица 3.13), т.е. броят на вариантите на една дискретна характеристика е доста голям.

Таблица 3.12. Разпределение на поданиците на юг федерален окръгРуската федерация по площ към 1 януари 2011 г

Таблица 3.13. Разпределение на субектите на Централния федерален окръг на Руската федерация по брой общински институцииобразование към 01.01.2011г

Правилата за конструиране на разпределителни серии са подобни на правилата за конструиране на групировки.

Анализът на сериите за разпределение може ясно да се извърши въз основа на техните графично изображение. За целта се изграждат полигон, хистограма и разпределения.

Многоъгълникизползва се при изобразяване на серия от разпределение на дискретни вариации. За да го вградите правоъгълна системакоординатите по абсцисната ос в същата скала нанасят класираните стойности на вариращата характеристика, а по ординатната ос се нанася скала, за да изрази големината на честотите. Получава се в пресечната точка на абсцисната ос (Х) и ординатните оси (Y) са свързани с прави линии, което води до прекъсната линия, наречен честотен полигон.

Хистограмаизползвани за изобразяване на серия от интервални вариации. При конструирането на хистограма стойностите на интервалите се нанасят върху абсцисната ос, а честотите се изобразяват с правоъгълници, изградени върху съответните интервали. Височината на колоните трябва да е пропорционална на честотите.

Хистограмата може да бъде преобразувана в многоъгълник на разпределение чрез свързване на средните точки на горните страни на правоъгълниците с прави линии.

При конструиране на хистограма на разпределението на вариационна серия с неравни интервали по ординатната ос се нанасят не честотите, а плътността на разпределението на характеристиката в съответните интервали. Плътност на разпределение - е честотата, изчислена за единица ширина на интервала,

тези. колко единици във всяка група са на единица интервална стойност.

Кумулативната крива може да се използва за графично показване на вариационни серии на разпределение. Като се използва кумулираизобразяват поредица от натрупани честоти. Натрупаните честоти се определят чрез последователно сумиране на честотите в групи.

При конструиране на кумулатите на интервалните вариационни серии по абсцисната ос (Х) са нанесени вариантите на серията, а по ординатната ос (Y) са натрупаните честоти, които са нанесени върху полето на графиката под формата на перпендикуляри на абсцисната ос в горни границиинтервали. След това тези перпендикуляри се свързват и се получава начупена линия, т.е. кумулират.

Ако при графично изобразяване на вариационна серия от разпределения под формата на кумулати на оста х и си разменяме местата, оказва се огива.

Изградени редове на количествена основа, са наречени вариационен.

Серията за разпространение се състои от настроики(характерни стойности) и честоти(брой групи). Честотите, изразени като относителни стойности(акции, проценти) се наричат честоти. Сумата от всички честоти се нарича обем на серията на разпределение.

По вид разпределителните серии са разделени на отделен(конструиран въз основа на прекъснати стойности на характеристиката) и интервал(построен на непрекъснати стойностизнак).

Вариационни сериипредставлява две колони (или редове); един от които предоставя индивидуални стойности на различна характеристика, наречени варианти и обозначени с X; а в другата - абсолютни числа, показващ колко пъти (колко често) се появява всяка опция. Индикаторите във втората колона се наричат ​​честоти и условно се означават с f. Нека отбележим още веднъж, че във втората колона и двете относителни показатели, характеризираща дела на честотата на отделните варианти в обща сумачестота Тези относителни показатели се наричат ​​честоти и условно се означават с ω. Сумата от всички честоти в този случай е равна на единица. Но честотите могат да бъдат изразени и като проценти и тогава сумата от всички честоти дава 100%.

Ако вариантите на вариационната серия са изразени във формата дискретни количества, тогава такава вариационна серия се нарича отделен.

За непрекъснати характеристики вариационните серии се конструират като интервал, тоест стойностите на атрибута в тях са изразени „от... до...“. В този случай минималните стойности на характеристиката в такъв интервал се наричат ​​долна граница на интервала, а максималните - горна граница.

Интервалните вариационни серии също са конструирани за дискретни характеристики, вариращи в широк обхват. Интервални серииможе да бъде с равенИ неравенна интервали.

Нека разгледаме как се определя стойността на равни интервали. Нека въведем следната нотация:

аз– размер на интервала;

- максималната стойност на характеристиката за единици съвкупност;

– минималната стойност на характеристиката за единици съвкупност;

н -брой разпределени групи.

, ако n е известно.

Ако броят на групите, които трябва да бъдат разграничени, е трудно да се определи предварително, тогава за изчисляване на оптималната стойност на интервала с достатъчен размер на популацията може да се препоръча формулата, предложена от Стърджис през 1926 г.:

n = 1+ 3,322 log N, където N е броят на единиците в съвкупността.

Размерът на неравните интервали се определя във всеки отделен случай, като се вземат предвид характеристиките на обекта на изследване.

Разпределение на статистическата извадкаизвикване на списък с опции и съответните им честоти (или относителни честоти).

Статистическото разпределение на извадката може да бъде посочено под формата на таблица, в първата колона на която са разположени опциите, а във втората - честотите, съответстващи на тези опции ni, или относителни честоти Пи .

Статистическо разпределение на извадката

Интервалните серии са вариационни серии, в които стойностите на характеристиките, лежащи в основата на тяхното формиране, са изразени в определени граници (интервали). Честотите в този случай не се отнасят за индивидуални ценностихарактеристика, но до целия интервал.

Сериите на интервалното разпределение се конструират въз основа на непрекъснати количествени характеристики, както и на дискретни характеристики, които варират в значителни граници.

Една интервална серия може да бъде представена чрез статистическо разпределение на извадка, посочваща интервалите и съответните им честоти. В този случай сумата от честотите на вариантите, попадащи в този интервал, се приема като честота на интервала.

При групирането по количествени непрекъснати признаци определянето на размера на интервала е важно.

В допълнение към средната стойност на извадката и дисперсията на извадката се използват и други характеристики на вариационните серии.

МодаИзвиква се вариантът, който има най-висока честота.

    Всички стойности на изследваното свойство, които се срещат в изследваната популация, се наричат ​​стойност на атрибута (опция, опция) и промяна в тази стойност чрез вариране. Опциите се обозначават с малки букви на латинската азбука с индекси, съответстващи на серийния номер на групата - х аз .

    Число, което показва колко пъти всяка характерна стойност се среща в изследваната популация честота и означават f аз . Сумата от всички честоти на серията е равна на обема на изследваната популация.

    Много често трябва да броите натрупана честота (С). Натрупаната честота за всяка характерна стойност показва колко единици от популацията имат характерна стойност не по-голяма от дадена стойност. Натрупаната честота се изчислява чрез последователно добавяне на следните стойности на атрибута към честотата на първата стойност на честотния знак:

Натрупаната честота започва да се изчислява от първата стойност на атрибута

Сумата от честотите винаги е равна на единица или 100%. Замяната на честотите с честоти позволява да се сравняват вариационни серии с различен брой наблюдения.

Честотите на серията (f i) в някои случаи могат да бъдат заменени с честотите (ω i).

Ако вариационната серия е дадена на неравни интервали, тогава за правилна представа за естеството на разпределението е необходимо да се изчисли абсолютната или относителната плътност на разпределението.

    Абсолютна плътност на разпределение (стр f ) представлява честотната стойност за единица размер на интервала отделна групаред:

Р f = f/ аз

    Относителна плътност на разпределение (стр ω ) представлява стойността на честотата на единица размер на интервала на отделна група от серията:

Р ω = ω / аз

За серии с неравни интервали само тези характеристики дават по-правилна представа за естеството на разпределението от честотата и честотата.

    Разпределение на статистическата извадка наименувайте списък с опции (стойности на знаци) и съответните им честоти или плътности на разпределение, относителни честоти или относителни плътностиразпределения.

Различните серии на разпределение се характеризират с различен набор от честотни характеристики:

минимален – серия от атрибути (честота, честота),

за дискретни се използват четири характеристики (честота, честота, натрупана честота, натрупана честота),

за интервални – и петте (честота, честота, натрупана честота, натрупана честота, абсолютна и относителна плътност на разпределение).

  1. Правила за построяване на интервална вариационна серия

  1. Графично представяне на вариационни серии

Първият етап от изучаването на вариационна серия е изграждането на нейното графично изображение. Графичното представяне на вариационни серии улеснява техния анализ и позволява да се прецени формата на разпределението. За графично представяне на вариационна серия в статистиката се изграждат хистограма, многоъгълник и кумулативно разпределение.

Серия от дискретни вариации е изобразена като така наречения честотен полигон.

За показване на интервална серия се използват полигон за разпределение на честотата и хистограма на честотата.

Графиките се изграждат в правоъгълна координатна система.