Математическо моделиране на детерминирани стохастични процеси. Детерминистични и стохастични модели

23 януари 2017 г

Стохастичният модел описва ситуация, в която има несигурност. С други думи, процесът се характеризира с известна степен на случайност. Самото прилагателно „стохастичен“ идва от гръцката дума „да гадая“. Тъй като несигурността е ключова характеристика на ежедневието, такъв модел може да опише всичко.

Въпреки това, всеки път, когато го използваме, ще получим различен резултат. Поради това по-често се използват детерминирани модели. Въпреки че не са възможно най-близо до реалното състояние на нещата, те винаги дават един и същ резултат и улесняват разбирането на ситуацията, опростяват я, като въвеждат набор от математически уравнения.

Основни характеристики

Стохастичният модел винаги включва една или повече случайни променливи. Тя се стреми да отразява реалния живот във всичките му проявления. За разлика от детерминистичния модел, стохастичният няма за цел да опрости всичко и да го сведе до известни стойности. Следователно несигурността е негова основна характеристика. Стохастичните модели са подходящи за описание на всичко, но всички те имат следните общи характеристики:

  • Всеки стохастичен модел отразява всички аспекти на проблема, който е създаден, за да изучава.
  • Резултатът от всяко събитие е несигурен. Следователно моделът включва вероятности. Правилността на общите резултати зависи от точността на тяхното изчисляване.
  • Тези вероятности могат да се използват за прогнозиране или описание на самите процеси.

Детерминистични и стохастични модели

За едни животът изглежда низ от случайни събития, за други – процеси, в които причината определя следствието. Всъщност тя се характеризира с несигурност, но не винаги и не във всичко. Поради това понякога е трудно да се намерят ясни разлики между стохастичните и детерминистичните модели. Вероятностите са доста субективен показател.

Например, помислете за ситуация с хвърляне на монета. На пръв поглед изглежда, че вероятността за кацане на „опашки“ е 50%. Следователно трябва да се използва детерминистичен модел. В действителност обаче се оказва, че много зависи от ловкостта на играчите и съвършенството на балансиране на монетата. Това означава, че трябва да използвате стохастичен модел. Винаги има параметри, които не знаем. В реалния живот причината винаги определя следствието, но има и известна степен на несигурност. Изборът между използването на детерминистични и стохастични модели зависи от това какво сме готови да пожертваме - лекота на анализ или реализъм.

Видео по темата

В теорията на хаоса

Напоследък концепцията кой модел се нарича стохастичен стана още по-размита. Това се дължи на развитието на така наречената теория на хаоса. Той описва детерминистични модели, които могат да дадат различни резултати с леки промени в първоначалните параметри. Това е като въведение в изчисляването на неопределеността. Много учени дори признаха, че това вече е стохастичен модел.

Лотар Бройер обяснява всичко изящно с поетични образи. Той пише: „Планински поток, туптящо сърце, епидемия от едра шарка, стълб от издигащ се дим – всичко това е пример за динамично явление, което понякога изглежда се характеризира със случайност. В действителност такива процеси винаги са подчинени на определен ред, който учените и инженерите едва започват да разбират. Това е така нареченият детерминистичен хаос." Новата теория звучи много правдоподобно, поради което много съвременни учени са нейни поддръжници. Въпреки това, той все още остава слабо развит и е доста труден за прилагане в статистическите изчисления. Поради това често се използват стохастични или детерминистични модели.

Строителство

Стохастичният математически модел започва с избора на пространство от елементарни резултати. Това е, което статистиката нарича списък с възможни резултати от процеса или събитието, което се изследва. След това изследователят определя вероятността за всеки от елементарните резултати. Обикновено това се прави въз основа на специфична методология.

Въпреки това, вероятностите все още са доста субективен параметър. След това изследователят определя кои събития изглеждат най-интересни за решаване на проблема. След това той просто определя тяхната вероятност.

Пример

Нека разгледаме процеса на конструиране на най-простия стохастичен модел. Да кажем, че хвърляме зарове. Ако се появи „шест“ или „едно“, нашата печалба ще бъде десет долара. Процесът на изграждане на стохастичен модел в този случай ще изглежда така:

  • Нека дефинираме пространството на елементарните резултати. Зарът има шест страни, така че хвърлянията могат да бъдат „едно“, „две“, „три“, „четири“, „пет“ и „шест“.
  • Вероятността за всеки резултат ще бъде 1/6, без значение колко пъти хвърляме заровете.
  • Сега трябва да определим резултатите, които ни интересуват. Това е падането на ръба с числото "шест" или "едно".
  • И накрая, можем да определим вероятността на събитието, което ни интересува. Това е 1/3. Сумираме вероятностите на двете елементарни събития, които ни интересуват: 1/6 + 1/6 = 2/6 = 1/3.

Концепция и резултат

Стохастичното моделиране често се използва в хазарта. Но също така е незаменим в икономическото прогнозиране, тъй като ни позволява да разберем ситуацията по-дълбоко от детерминистичните. Стохастичните модели в икономиката често се използват при вземане на инвестиционни решения. Те ви позволяват да правите предположения относно рентабилността на инвестициите в определени активи или групи от активи.

Моделирането прави финансовото планиране по-ефективно. С негова помощ инвеститорите и търговците оптимизират разпределението на активите си. Използването на стохастично моделиране винаги носи ползи в дългосрочен план. В някои индустрии отказът или невъзможността да се приложи може дори да доведе до фалит на предприятието. Това се дължи на факта, че в реалния живот всеки ден се появяват нови важни параметри и ако не се вземат предвид, това може да има катастрофални последици.

Математически модели в икономиката и програмирането

1. Детерминистични и вероятностни математически модели в икономиката. Предимства и недостатъци

Методите за изследване на икономическите процеси се основават на използването на математически - детерминистични и вероятностни - модели, представящи процеса, системата или вида дейност, които се изучават. Такива модели предоставят количествено описание на проблема и служат като основа за вземане на управленски решения при търсене на оптималния вариант. Колко оправдани са тези решения, възможно ли са най-добрите, взети ли са под внимание и претеглени ли са всички фактори, които определят оптималното решение, какъв е критерият, за да се определи, че това решение наистина е най-доброто - това е кръгът от въпроси, които голямо значение за производствените мениджъри и отговорът на който може да се намери с помощта на методи за изследване на операциите [Чесноков С.В. Детерминистичен анализ на социално-икономически данни. - М.: Наука, 1982, с. 45].

Един от принципите за формиране на система за управление е методът на кибернетичните (математически) модели. Математическото моделиране заема междинна позиция между експеримента и теорията: няма нужда да се изгражда реален физически модел на системата, той ще бъде заменен от математически модел. Особеността на формирането на система за управление се състои във вероятностния, статистически подход към процесите на управление. В кибернетиката се приема, че всеки процес на управление е обект на случайни, смущаващи влияния. По този начин производственият процес се влияе от голям брой фактори, които не могат да бъдат взети предвид по детерминистичен начин. Следователно производственият процес се счита за повлиян от случайни сигнали. Поради това планирането на предприятието може да бъде само вероятностно.

Поради тези причини, когато се говори за математическо моделиране на икономически процеси, те често имат предвид вероятностни модели.

Нека опишем всеки тип математически модел.

Детерминистичните математически модели се характеризират с това, че описват връзката на някои фактори с ефективен показател като функционална зависимост, т.е. в детерминистичните модели ефективният показател на модела се представя под формата на произведение, частно, алгебрична сума от фактори или под формата на друга функция. Този тип математически модели е най-често срещаният, тъй като, тъй като е доста прост за използване (в сравнение с вероятностните модели), той позволява да се разбере логиката на действие на основните фактори в развитието на икономическия процес, да се определи количествено тяхното влияние, разбира кои фактори и в какви пропорции е възможно и препоръчително да се променят за повишаване на ефективността на производството.

Вероятностните математически модели са фундаментално различни от детерминистичните по това, че при вероятностните модели връзката между факторите и произтичащия атрибут е вероятностна (стохастична): с функционална зависимост (детерминистични модели) едно и също състояние на факторите съответства на едно състояние на резултатния атрибут, докато при вероятностните модели едно и също състояние на факторите съответства на цял набор от състояния на резултантния атрибут [Толстова Ю. Н. Логика на математическия анализ на икономическите процеси. - М.: Наука, 2001, с. 32-33].

Предимството на детерминистичните модели е тяхната лекота на използване. Основният недостатък е ниската адекватност на реалността, тъй като, както беше отбелязано по-горе, повечето икономически процеси са вероятностни по природа.

Предимството на вероятностните модели е, че като правило те са по-съгласувани с реалността (по-адекватни) от детерминистичните. Недостатъкът на вероятностните модели обаче е сложността и трудоемкостта на тяхното приложение, така че в много ситуации е достатъчно да се ограничим до детерминистични модели.

2. Постановка на проблема с линейното програмиране, използвайки примера на проблема с хранителната дажба

За първи път формулиране на задача за линейно програмиране под формата на предложение за съставяне на оптимален транспортен план; което позволява да се сведе до минимум общият пробег е дадено в работата на съветския икономист А. Н. Толстой през 1930 г.

Систематичните изследвания на проблемите на линейното програмиране и разработването на общи методи за тяхното решаване са доразвити в трудовете на руските математици Л. В. Канторович, В. С. Немчинов и други математици и икономисти. Също така много работи на чуждестранни и преди всичко американски учени са посветени на методите на линейно програмиране.

Проблемът с линейното програмиране е да се максимизира (минимизира) линейна функция.

под ограничения

и всичко

Коментирайте. Неравенствата могат да имат и противоположни значения. Чрез умножаване на съответните неравенства по (-1) винаги може да се получи система от вида (*).

Ако броят на променливите на ограничителната система и целевата функция в математическия модел на задачата е 2, тогава тя може да бъде решена графично.

И така, трябва да максимизираме функцията до удовлетворяваща система от ограничения.

Нека се обърнем към едно от неравенствата на системата от ограничения.

От геометрична гледна точка всички точки, които удовлетворяват това неравенство, трябва или да лежат на правата, или да принадлежат на една от полуравнините, на които е разделена равнината на тази права. За да разберете, трябва да проверите кой от тях съдържа точка ().

Забележка 2. Ако , тогава е по-лесно да вземете точката (0;0).

Условията за неотрицателност също определят полуравнини, съответно, с гранични линии. Да приемем, че системата от неравенства е последователна, тогава полуравнините, пресичайки се, образуват обща част, която е изпъкнало множество и представлява множество от точки, чиито координати са решение на тази система - това е множеството на допустимите решения. Наборът от тези точки (решения) се нарича многоъгълник на решение. Може да бъде точка, лъч, многоъгълник или неограничена многоъгълна област. По този начин задачата на линейното програмиране е да се намери точка в полигона на решение, в която целевата функция приема максимална (минимална) стойност. Тази точка съществува, когато многоъгълникът на решението не е празен и целевата функция върху него е ограничена отгоре (отдолу). При посочените условия в един от върховете на полигона на решението целевата функция приема максимална стойност. За да определим този връх, построяваме права линия (където h е някаква константа). Най-често се взема права линия. Остава да разберем посоката на движение на тази линия. Тази посока се определя от градиента (антиградиента) на целевата функция.

Векторът във всяка точка е перпендикулярен на правата, така че стойността на f ще нараства, когато линията се движи в посоката на градиента (намалява в посоката на антиградиента). За да направите това, начертайте прави линии, успоредни на правата линия, измествайки се в посоката на градиента (анти-градиент).

Ще продължим тези конструкции, докато правата премине през последния връх на многоъгълника на решението. Тази точка определя оптималната стойност.

И така, намирането на решение на проблем с линейно програмиране с помощта на геометричния метод включва следните стъпки:

Построени са прави, чиито уравнения се получават чрез замяна на знаците за неравенство в ограниченията с точни знаци за равенство.

Намерете полуравнините, определени от всяко от ограниченията на проблема.

Намерете полигон за решение.

Изградете вектор.

Те изграждат права линия.

Построяват успоредни прави по посока на градиента или антиградиента, в резултат на което намират точката, в която функцията приема максимална или минимална стойност, или установяват, че функцията е неограничена отгоре (отдолу) върху допустим набор.

Определят се координатите на точката на максимум (минимум) на функцията и се изчислява стойността на целевата функция в тази точка.

Проблем за рационалното хранене (проблем за хранителната дажба)

Постановка на проблема

Във фермата се угояват добитък с търговска цел. За простота, нека приемем, че има само четири вида продукти: P1, P2, P3, P4; Единичната цена на всеки продукт е равна съответно на C1, C2, C3, C4. От тези продукти трябва да създадете диета, която трябва да съдържа: протеини - най-малко b1 единици; въглехидрати - най-малко b2 единици; мазнини - най-малко b3 единици. За продуктите P1, P2, P3, P4 съдържанието на протеини, въглехидрати и мазнини (в единици за единица продукт) е известно и посочено в таблицата, където aij (i=1,2,3,4; j=1 ,2,3) - някои конкретни числа; първият индекс показва номера на продукта, вторият - номерът на елемента (протеини, въглехидрати, мазнини).

Системните модели, за които говорихме досега, бяха детерминистични (сигурни), т.е. настройката на входното влияние определя еднозначно изхода на системата. На практика обаче това се случва рядко: описанието на реалните системи обикновено е присъщо на несигурност. Например, за статичен модел, несигурността може да бъде взета предвид чрез записване на връзката (2.1)

където е грешката, нормализирана към системния изход.

Причините за несигурността са различни:

– грешки и смущения в измерванията на системните входове и изходи (естествени грешки);

– неточност на самия модел на системата, което налага изкуствено внасяне на грешка в модела;

– непълна информация за системни параметри и др.

Сред различните методи за изясняване и формализиране на несигурността най-разпространен е хаотичният (вероятностният) подход, при който несигурните количества се считат за случайни. Разработеният концептуален и изчислителен апарат на теорията на вероятностите и математическата статистика ни позволява да дадем конкретни препоръки за избора на структурата на системата и оценката на нейните параметри. Класификацията на стохастичните модели на системите и методите за тяхното изследване е представена в табл. 1.4. Изводите и препоръките се основават на ефекта на осредняване: случайните отклонения на резултатите от измерването на определено количество от очакваната му стойност се компенсират взаимно при сумиране и средноаритметичното от голям брой измервания се оказва близко до очакваната стойност . Математическите формулировки на този ефект са дадени от закона за големите числа и централната гранична теорема. Законът за големите числа гласи, че ако са случайни променливи с математическо очакване (средна стойност) и дисперсия, тогава



при достатъчно големи Н. Това показва фундаменталната възможност за извършване на произволно точна оценка въз основа на измервания. Централната гранична теорема, изясняваща (2.32), гласи това

където е стандартна нормално разпределена случайна променлива

Тъй като разпределението на количеството е добре известно и таблично (например, известно е, че връзката (2.33) позволява да се изчисли грешката на оценката. Нека, например, искате да намерите при какъв брой измервания грешката в оценката тяхното математическо очакване с вероятност от 0,95 ще бъде по-малко от 0,01, ако дисперсията на всяко измерване е 0,25 От (2.33) получаваме, че трябва да е в сила следното неравенство: N> 10000.

Разбира се, формулировките (2.32), (2.33) могат да бъдат дадени в по-строга форма и това може лесно да се направи с помощта на концепциите за вероятностна конвергенция. Трудности възникват, когато се опитвате да тествате условията на тези строги твърдения. Например, законът за големите числа и централната гранична теорема изискват независимостта на отделните измервания (реализации) на случайна променлива и ограничеността на нейната дисперсия. Ако тези условия са нарушени, тогава заключенията също могат да бъдат нарушени. Например, ако всички измервания съвпадат: тогава, въпреки че всички други условия са изпълнени, не може да става дума за осредняване. Друг пример: законът за големите числа е несправедлив, ако случайните променливи се разпределят според закона на Коши (с плътност на разпределение, която няма крайно математическо очакване и дисперсия. Но такъв закон се среща в живота! Например, според Коши, цялостното осветяване на точки на прав бряг от равномерно въртящ се прожектор, разположен в морето (на кораб) и включващ се в произволни моменти.

Но още по-големи трудности възникват при проверката на валидността на самото използване на термина „случаен“. Какво е случайна променлива, случайно събитие и т.н. Често се казва, че едно събитие Аслучайно, ако в резултат на експеримента може да се случи (с вероятност п)или не се случва (с вероятност 1- p).Всичко обаче не е толкова просто. Самата концепция за вероятност може да бъде свързана с резултатите от експериментите само чрез честотата на нейното появяване в определен брой (серия) от експерименти: , където N A- броя на експериментите, в които е настъпило събитието, Н- общ брой; експерименти. Ако числата са достатъчно големи Нсе доближава до някакво постоянно число r A:

това събитие Аможе да се нарече случаен, а броят r- неговата вероятност. В този случай честотите, наблюдавани в различни серии от експерименти, трябва да са близки една до друга (това свойство се нарича статистическа стабилностили хомогенност).Горното се отнася и за концепцията за случайна променлива, тъй като стойността е случайна, ако събитията са случайни (и<£<Ь} для любых чисел А,b.Честотите на възникване на такива събития в дълги серии от експерименти трябва да се групират около определени постоянни стойности.

Така че, за да бъде приложим стохастичният подход, трябва да бъдат изпълнени следните изисквания:

1) огромният мащаб на експериментите, които се провеждат, т.е. доста голям брой;

2) повторяемост на експерименталните условия, оправдаваща сравнението на резултатите от различни експерименти;

3) статистическа стабилност.

Стохастичният подход очевидно не може да се приложи към отделни експерименти: изрази като „вероятността утре да вали“, „с вероятност 0,8 Зенит ще спечели купата“ и т.н. са безсмислени. Но дори ако експериментите са широко разпространени и повтаряеми, може да няма статистическа стабилност и проверката на това не е лесна задача. Известните оценки на допустимото отклонение на честотата от вероятността се основават на централната гранична теорема или неравенството на Чебишев и изискват допълнителни хипотези за независимостта или слабата зависимост на измерванията. Експерименталната проверка на условието за независимост е още по-трудна, тъй като изисква допълнителни експерименти.

Методологията и практическите рецепти за прилагане на теорията на вероятностите са представени по-подробно в учебната книга на V.N. Тутубалин, представа за което се дава от цитатите по-долу:

„Изключително важно е да се изкорени погрешното схващане, което понякога се среща сред инженерите и естествените учени, които не са достатъчно запознати с теорията на вероятностите, че резултатът от всеки експеримент може да се разглежда като случайна променлива. В особено тежки случаи това е придружено от вяра в нормалния закон за разпределение и ако самите случайни променливи не са нормални, тогава те вярват, че техните логаритми са нормални.

„Според съвременните концепции обхватът на приложение на методите на теорията на вероятностите е ограничен до явления, които се характеризират със статистическа стабилност. Тестването на статистическата стабилност обаче е трудно и винаги непълно и често дава отрицателно заключение. В резултат на това в цели области на знанието, например в геологията, подходът се превърна в норма, при която статистическата стабилност изобщо не се проверява, което неизбежно води до сериозни грешки. В допълнение, пропагандата на кибернетиката, предприета от нашите водещи учени, даде (в някои случаи!) малко неочакван резултат: сега се смята, че само машина (а не човек) е способна да получи обективни научни резултати.

При такива обстоятелства дълг на всеки учител е отново и отново да разпространява онази стара истина, която Петър I се опитва (безуспешно) да внуши на руските търговци: че трябва да се търгува честно, без измама, тъй като в крайна сметка това е по-изгодно за себе си.”

Как да изградим модел на система, ако има несигурност в проблема, но стохастичният подход не е приложим? По-долу очертаваме накратко един от алтернативните подходи, базиран на теорията на размитите множества.


Напомняме ви, че релацията (връзката между и) е подмножество на множество. тези. някакъв набор от двойки R=(( х, при)), Къде,. Например функционална връзка (зависимост) може да бъде представена като връзка между множества, включително двойки ( X, при), за което.

В най-простия случай може да бъде R е отношение на идентичност, ако.

Примери 12-15 в табл. 1. 1 са изобретени през 1988 г. от ученик от 86 клас на училище 292 М. Коротеев.

Математикът тук, разбира се, ще забележи, че минимумът в (1.4), строго погледнато, може да не бъде постигнат и във формулировката на (1.4) е необходимо да се замени rnin с inf („infimum“ е точният infimum на комплект). Това обаче няма да промени ситуацията: формализацията в този случай не отразява същността на задачата, т.е. извършено неправилно. В бъдеще, за да не „изплашим” инженера, ще използваме нотацията min, max; като се има предвид, че при необходимост те трябва да се заменят с по-общите инф., суп.

Тук терминът „структура“ се използва в малко по-тесен смисъл, както в подраздел. 1.1, и означава състава на подсистемите в системата и видовете връзки между тях.

Графиката е двойка ( Ж, Р), където G=(g 1 ... g n) е краен набор от върхове, a - двоично отношение към Ж.Ако, тогава и само ако, тогава графът се нарича неориентиран, в противен случай - насочен. Двойките се наричат ​​дъги (ръбове), а елементите на множеството Ж- върховете на графа.

Тоест алгебричен или трансцендентален.

Строго погледнато, изброимото множество е определена идеализация, която не може да бъде реализирана на практика поради крайния размер на техническите системи и ограниченията на човешкото възприятие. Такива идеализирани модели (например набор от естествени числа Н=(1, 2,...)) има смисъл да се въведе за крайни множества, но с предварително неограничен (или неизвестен) брой елементи.

Формално понятието операция е частен случай на понятието връзка между елементи на множества. Например операцията за събиране на две числа определя 3-местна (троична) връзка R:три числа (x, y, z) z) принадлежи към отношението Р(пишем (x,y,z)), ако z = x+y.

Комплексно число, аргумент от полиноми А(), IN().

Това предположение често се среща на практика.

Ако количеството е неизвестно, то трябва да се замени в (2.33) с оценката, където В този случай количеството вече няма да се разпределя нормално, а според закона на Стюдънт, който при е практически неразличим от нормалното.

Лесно е да се види, че (2.34) е специален случай на (2.32), когато вземем събитието Авлезе j- m експеримент, иначе. В същото време

И днес можете да добавите „... и компютърни науки“ (бел. на автора).

Стохастични модели

Както бе споменато по-горе, стохастичните модели са вероятностни модели. Освен това в резултат на изчисленията е възможно да се каже с достатъчна степен на вероятност каква ще бъде стойността на анализирания показател, ако факторът се промени. Най-често срещаното приложение на стохастичните модели е прогнозирането.

Стохастичното моделиране до известна степен е допълнение и задълбочаване на детерминистичния факторен анализ. Във факторния анализ тези модели се използват по три основни причини:

  • необходимо е да се изследва влиянието на фактори, за които е невъзможно да се изгради строго определен факторен модел (например нивото на финансов ливъридж);
  • необходимо е да се изследва влиянието на комплексни фактори, които не могат да се комбинират в един и същи строго определен модел;
  • необходимо е да се изследва влиянието на сложни фактори, които не могат да бъдат изразени с един количествен показател (например нивото на научно-техническия прогрес).

За разлика от строго детерминистичния подход, стохастичният подход изисква редица предпоставки за прилагане:

  1. наличието на население;
  2. достатъчен обем наблюдения;
  3. случайност и независимост на наблюденията;
  4. еднаквост;
  5. наличието на разпределение на характеристики, близки до нормалните;
  6. наличието на специален математически апарат.

Изграждането на стохастичен модел се извършва на няколко етапа:

  • качествен анализ (задаване на целта на анализа, дефиниране на популацията, определяне на ефективните и факторни характеристики, избор на периода, за който се извършва анализът, избор на метод за анализ);
  • предварителен анализ на симулираната популация (проверка на хомогенността на популацията, изключване на аномални наблюдения, изясняване на необходимия размер на извадката, установяване на законите на разпределение за изследваните показатели);
  • изграждане на стохастичен (регресионен) модел (изясняване на списъка с фактори, изчисляване на оценките на параметрите на регресионното уравнение, изброяване на конкурентни варианти на модела);
  • оценка на адекватността на модела (проверка на статистическата значимост на уравнението като цяло и на отделните му параметри, проверка на съответствието на формалните свойства на оценките с целите на изследването);
  • икономическо тълкуване и практическо използване на модела (определяне на пространствено-времевата устойчивост на изградената връзка, оценка на практическите свойства на модела).

Основни понятия на корелационния и регресионния анализ

Корелационен анализ -набор от методи на математическата статистика, които позволяват да се оценят коефициенти, характеризиращи корелацията между случайни променливи и тестови хипотези за техните стойности въз основа на изчисляването на техните примерни аналози.

Корелационен анализе метод за обработка на статистически данни, който включва изучаване на коефициенти (корелация) между променливи.

Корелация(което също се нарича непълно или статистическо) се проявява средно за масови наблюдения, когато дадените стойности на зависимата променлива съответстват на определен брой вероятни стойности на независимата променлива. Обяснението за това е сложността на връзките между анализираните фактори, чието взаимодействие се влияе от неотчетени случайни величини. Следователно връзката между знаците се проявява само средно, в масата на случаите. В корелационна връзка всяка стойност на аргумент съответства на стойности на функцията, произволно разпределени в определен интервал.

В най-общ вид задачата на статистиката (и съответно на икономическия анализ) в областта на изучаването на взаимоотношенията е да определи количествено тяхното присъствие и посока, както и да характеризира силата и формата на влияние на едни фактори върху други. За решаването му се използват две групи методи, едната от които включва методи на корелационен анализ, а другата – регресионен анализ. В същото време редица изследователи комбинират тези методи в корелационно-регресионен анализ, който има някаква основа: наличието на редица общи изчислителни процедури, взаимно допълване в интерпретацията на резултатите и др.

Следователно в този контекст можем да говорим за корелационен анализ в широк смисъл – когато връзката се характеризира всестранно. В същото време има корелационен анализ в тесен смисъл - когато се изследва силата на връзката - и регресионен анализ, по време на който се оценява нейната форма и влиянието на едни фактори върху други.

Самите задачи корелационен анализсе свеждат до измерване на близостта на връзката между различни характеристики, определяне на неизвестни причинно-следствени връзки и оценка на факторите, които имат най-голямо влияние върху получената характеристика.

Задачи регресионен анализлежат в областта на установяване на формата на зависимостта, определяне на регресионната функция и използване на уравнение за оценка на неизвестните стойности на зависимата променлива.

Решаването на тези проблеми се основава на подходящи техники, алгоритми и показатели, което дава основание да се говори за статистическо изследване на връзките.

Трябва да се отбележи, че традиционните методи на корелация и регресия са широко представени в различни статистически софтуерни пакети за компютри. Изследователят може само да подготви правилно информацията, да избере софтуерен пакет, който отговаря на изискванията за анализ и да бъде готов да интерпретира получените резултати. Има много алгоритми за изчисляване на комуникационните параметри и в момента едва ли е препоръчително да се извършва такъв сложен тип анализ ръчно. Изчислителните процедури са от независим интерес, но познаването на принципите на изучаване на връзките, възможностите и ограниченията на определени методи за интерпретиране на резултати е предпоставка за изследване.

Методите за оценка на силата на връзката се делят на корелационни (параметрични) и непараметрични. Параметричните методи се основават на използването, като правило, на оценки на нормалното разпределение и се използват в случаите, когато изследваната популация се състои от стойности, които се подчиняват на закона за нормалното разпределение. В практиката тази позиция най-често се приема a priori. Всъщност тези методи са параметрични и обикновено се наричат ​​корелационни методи.

Непараметричните методи не налагат ограничения върху закона за разпределение на изследваните величини. Предимството им е простотата на изчисленията.

Автокорелация- статистическа връзка между случайни величини от една и съща серия, но взети с изместване, например за случаен процес - с изместване във времето.

Корелация по двойки



Най-простият начин за идентифициране на връзка между две характеристики е да се конструира корелационна таблица:

\Y\X\ Y 1 Y2 ... Y z Общо Y i
X 1 е 11 ... f 1z
X 1 е 21 ... f 2z
... ... ... ... ... ... ...
Xr f k1 k2 ... f kz
Общо ... п
... -

Групирането се основава на две характеристики, изследвани във връзка - X и Y. Честотите f ij показват броя на съответните комбинации от X и Y.

Ако f ij са разположени произволно в таблицата, можем да говорим за липса на връзка между променливите. В случай на образуване на всяка характерна комбинация f ij е допустимо да се твърди връзка между X и Y. Освен това, ако f ij е концентриран близо до един от двата диагонала, се осъществява пряка или обратна линейна връзка.

Визуално представяне на корелационната таблица е корелационно поле.Това е графика, където стойностите X са нанесени на абсцисната ос, стойностите на Y са нанесени на ординатната ос, а комбинацията от X и Y е показана с точки чрез местоположението на точките и техните концентрации в a определена посока, може да се прецени наличието на връзка.

Корелационно полесе нарича набор от точки (X i, Y i) в равнината XY (фигури 6.1 - 6.2).

Ако точките на корелационното поле образуват елипса, чийто основен диагонал има положителен ъгъл на наклон (/), тогава възниква положителна корелация (пример за такава ситуация може да се види на фигура 6.1).

Ако точките на корелационното поле образуват елипса, чийто основен диагонал има отрицателен ъгъл на наклон (\), тогава има отрицателна корелация (пример е показан на фигура 6.2).

Ако няма модел в местоположението на точките, тогава те казват, че в този случай има нулева корелация.

В резултатите от корелационната таблица са дадени две разпределения в редове и колони – едното за X, другото за Y. Нека изчислим средната стойност на Y за всяко Xi, т.е. , Как

Последователността от точки (X i, ) дава графика, която илюстрира зависимостта на средната стойност на ефективния атрибут Y от фактора X, – емпирична регресионна линия,ясно показва как Y се променя, когато X се променя.

По същество корелационната таблица, корелационното поле и емпиричната регресионна линия вече предварително характеризират връзката, когато факторът и произтичащите характеристики са избрани и е необходимо да се формулират предположения за формата и посоката на връзката. В същото време количествената оценка на херметичността на връзката изисква допълнителни изчисления.