Do estymacji stosowana jest metoda najmniejszych kwadratów. Najprostsze przypadki specjalne

Przykład.

Dane eksperymentalne dotyczące wartości zmiennych X I Na podano w tabeli.

W wyniku ich wyrównania uzyskuje się funkcję

Za pomocą metoda najmniejszych kwadratów, aproksymuj te dane za pomocą zależności liniowej y=topór+b(znajdź parametry A I B). Dowiedz się, która z dwóch linii lepiej (w sensie metody najmniejszych kwadratów) wyrównuje dane eksperymentalne. Narysuj coś.

Istota metody najmniejszych kwadratów (LSM).

Zadanie polega na znalezieniu współczynników zależności liniowej, przy której funkcjonuje funkcja dwóch zmiennych A I B przyjmuje najmniejszą wartość. To znaczy, dane A I B suma kwadratów odchyleń danych eksperymentalnych od znalezionej prostej będzie najmniejsza. Na tym polega cały sens metody najmniejszych kwadratów.

Zatem rozwiązanie przykładu sprowadza się do znalezienia ekstremum funkcji dwóch zmiennych.

Wyprowadzanie wzorów na znalezienie współczynników.

Układ dwóch równań z dwiema niewiadomymi jest kompilowany i rozwiązywany. Znajdowanie pochodnych cząstkowych funkcji po zmiennych A I B, przyrównujemy te pochodne do zera.

Powstały układ równań rozwiązujemy dowolną metodą (np metodą podstawieniową lub ) i uzyskać wzory na znalezienie współczynników metodą najmniejszych kwadratów (LSM).

Dany A I B funkcjonować przyjmuje najmniejszą wartość. Podano dowód tego faktu.

To cała metoda najmniejszych kwadratów. Wzór na znalezienie parametru A zawiera sumy , , i parametr N- ilość danych eksperymentalnych. Zalecamy oddzielne obliczanie wartości tych kwot. Współczynnik B znalezione po obliczeniach A.

Czas przypomnieć sobie oryginalny przykład.

Rozwiązanie.

W naszym przykładzie n=5. Wypełniamy tabelę dla wygody obliczenia kwot uwzględnionych we wzorach wymaganych współczynników.

Wartości w czwartym wierszu tabeli uzyskuje się poprzez pomnożenie wartości drugiego wiersza przez wartości trzeciego wiersza dla każdej liczby I.

Wartości w piątym wierszu tabeli uzyskuje się przez podniesienie do kwadratu wartości w drugim wierszu dla każdej liczby I.

Wartości w ostatniej kolumnie tabeli są sumami wartości w wierszach.

Do znalezienia współczynników używamy wzorów metody najmniejszych kwadratów A I B. Podstawiamy do nich odpowiednie wartości z ostatniej kolumny tabeli:

Stąd, y = 0,165x+2,184- żądana przybliżająca linia prosta.

Pozostaje dowiedzieć się, która z linii y = 0,165x+2,184 Lub lepiej przybliża oryginalne dane, czyli dokonuje oszacowania metodą najmniejszych kwadratów.

Estymacja błędu metodą najmniejszych kwadratów.

Aby to zrobić, musisz obliczyć sumę kwadratów odchyleń oryginalnych danych od tych linii I , mniejsza wartość odpowiada linii, która lepiej przybliża oryginalne dane w sensie metody najmniejszych kwadratów.

Od , potem prosto y = 0,165x+2,184 lepiej przybliża oryginalne dane.

Graficzna ilustracja metody najmniejszych kwadratów (LS).

Wszystko doskonale widać na wykresach. Czerwona linia to znaleziona linia prosta y = 0,165x+2,184, niebieska linia to , różowe kropki to dane oryginalne.

Dlaczego jest to potrzebne, po co te wszystkie przybliżenia?

Osobiście używam go do rozwiązywania problemów związanych z wygładzaniem danych, interpolacją i ekstrapolacją (w oryginalnym przykładzie można zostać poproszony o znalezienie wartości obserwowanej wartości y Na x=3 albo kiedy x=6 metodą najmniejszych kwadratów). Ale porozmawiamy o tym więcej później w innej części witryny.

Dowód.

Tak więc, gdy zostanie znaleziony A I B funkcja przyjmuje najmniejszą wartość, konieczne jest, aby w tym miejscu macierz postaci kwadratowej różniczki drugiego rzędu dla funkcji był dodatnio określony. Pokażmy to.

Istotą metody najmniejszych kwadratów jest w znalezieniu parametrów modelu trendu, który najlepiej opisuje tendencję rozwoju dowolnego zjawiska losowego w czasie lub przestrzeni (trend to linia charakteryzująca tendencję tego rozwoju). Zadanie metody najmniejszych kwadratów (LSM) sprowadza się do znalezienia nie tylko jakiegoś modelu trendu, ale znalezienia modelu najlepszego, czyli optymalnego. Model ten będzie optymalny, jeśli suma kwadratów odchyleń pomiędzy obserwowanymi wartościami rzeczywistymi a odpowiadającymi im obliczonymi wartościami trendu będzie minimalna (najmniejsza):

gdzie jest kwadratowym odchyleniem pomiędzy obserwowaną wartością rzeczywistą

i odpowiadająca obliczona wartość trendu,

Rzeczywista (obserwowana) wartość badanego zjawiska,

Obliczona wartość modelu trendu,

Liczba obserwacji badanego zjawiska.

MNC jest używany dość rzadko samodzielnie. Z reguły najczęściej stosuje się ją jedynie jako niezbędną technikę techniczną w badaniach korelacyjnych. Należy pamiętać, że podstawą informacyjną OLS może być jedynie rzetelny szereg statystyczny, a liczba obserwacji nie powinna być mniejsza niż 4, w przeciwnym razie procedury wygładzające OLS mogą stracić zdrowy rozsądek.

Zestaw narzędzi MNC sprowadza się do następujących procedur:

Pierwsza procedura. Okazuje się, czy w ogóle istnieje tendencja do zmiany wynikowego atrybutu w przypadku zmiany wybranego czynnika-argumentu, czyli innymi słowy, czy istnieje związek pomiędzy „ Na " I " X ».

Druga procedura. Określa się, która linia (trajektoria) najlepiej opisuje lub charakteryzuje ten trend.

Trzecia procedura.

Przykład. Załóżmy, że dysponujemy informacją o średnim plonie słonecznika w badanym gospodarstwie (tabela 9.1).

Tabela 9.1

Numer obserwacji

Wydajność, c/ha

Ponieważ poziom technologii produkcji słonecznika w naszym kraju na przestrzeni ostatnich 10 lat praktycznie się nie zmienił, oznacza to, że najwyraźniej wahania plonów w analizowanym okresie były w dużej mierze zależne od wahań warunków pogodowych i klimatycznych. Czy to naprawdę prawda?

Pierwsza procedura OLS. Testowana jest hipoteza o istnieniu trendu zmian plonów słonecznika w zależności od zmian warunków pogodowych i klimatycznych w ciągu analizowanych 10 lat.

W tym przykładzie dla „ y "wskazane jest zbieranie plonów słonecznika i dla" X » – numer roku obserwowanego w analizowanym okresie. Testowanie hipotezy o istnieniu jakiejkolwiek zależności pomiędzy „ X " I " y „można to zrobić na dwa sposoby: ręcznie i za pomocą programów komputerowych. Oczywiście, dzięki dostępności technologii komputerowej, problem ten można rozwiązać sam. Aby jednak lepiej zrozumieć narzędzia MNC, wskazane jest przetestowanie hipotezy o istnieniu związku pomiędzy „ X " I " y » ręcznie, gdy pod ręką jest tylko długopis i zwykły kalkulator. W takich przypadkach hipotezę o istnieniu trendu najlepiej sprawdzić wizualnie poprzez lokalizację obrazu graficznego analizowanego szeregu dynamiki – pola korelacji:

Pole korelacji w naszym przykładzie jest umiejscowione wokół wolno rosnącej linii. To samo w sobie wskazuje na istnienie pewnego trendu w zmianach plonów słonecznika. O występowaniu jakiejkolwiek tendencji nie można mówić tylko wtedy, gdy pole korelacji ma postać koła, koła, chmury ściśle pionowej lub ściśle poziomej, albo składa się z chaotycznie rozproszonych punktów. We wszystkich pozostałych przypadkach hipoteza o istnieniu związku pomiędzy „ X " I " y " i kontynuuj badania.

Druga procedura OLS. Określa się, która linia (trajektoria) najlepiej opisuje lub charakteryzuje trend zmian plonu słonecznika w analizowanym okresie.

Jeśli dysponujesz technologią komputerową, wybór optymalnego trendu następuje automatycznie. W przetwarzaniu „ręcznym” wybór optymalnej funkcji odbywa się z reguły wizualnie - poprzez lokalizację pola korelacji. Oznacza to, że w zależności od rodzaju wykresu wybierane jest równanie prostej, które najlepiej pasuje do trendu empirycznego (rzeczywistej trajektorii).

Jak wiadomo, w przyrodzie istnieje ogromna różnorodność zależności funkcjonalnych, dlatego niezwykle trudno jest wizualnie przeanalizować nawet niewielką ich część. Na szczęście w rzeczywistej praktyce gospodarczej większość zależności można dość dokładnie opisać za pomocą paraboli, hiperboli lub linii prostej. Pod tym względem dzięki „ręcznej” opcji wyboru najlepszej funkcji można ograniczyć się tylko do tych trzech modeli.

Hiperbola:

Parabola drugiego rzędu: :

Łatwo zauważyć, że w naszym przykładzie trend zmian plonów słonecznika na przestrzeni analizowanych 10 lat najlepiej charakteryzuje się linią prostą, zatem równanie regresji będzie równaniem linii prostej.

Trzecia procedura. Obliczane są parametry równania regresji charakteryzujące tę prostą, czyli innymi słowy wyznaczany jest wzór analityczny opisujący najlepszy model trendu.

Znalezienie wartości parametrów równania regresji, w naszym przypadku parametrów i , jest podstawą OLS. Proces ten sprowadza się do rozwiązania układu równań normalnych.

(9.2)

Ten układ równań można dość łatwo rozwiązać metodą Gaussa. Przypomnijmy, że w wyniku rozwiązania w naszym przykładzie zostają znalezione wartości parametrów i. Zatem znalezione równanie regresji będzie miało następującą postać:

  • Instruktaż

Wstęp

Jestem matematykiem i programistą. Największym krokiem w mojej karierze był moment, gdy nauczyłem się mówić: "Niczego nierozumiem!" Teraz nie wstydzę się powiedzieć luminarzowi nauki, że wygłasza dla mnie wykład, że nie rozumiem, co on, luminarz, mówi mi. I to jest bardzo trudne. Tak, przyznanie się do swojej niewiedzy jest trudne i zawstydzające. Kto lubi przyznać się do tego, że nie zna jakiejś podstawy? Ze względu na zawód muszę uczestniczyć w dużej liczbie prezentacji i wykładów, z których, przyznaję, w zdecydowanej większości przypadków chce mi się spać, bo nic nie rozumiem. Ale nie rozumiem, bo ogromny problem obecnej sytuacji w nauce leży w matematyce. Zakłada, że ​​wszyscy słuchacze znają absolutnie wszystkie dziedziny matematyki (co jest absurdem). Przyznanie się, że nie wiesz, czym jest pochodna (o tym, czym jest, porozmawiamy nieco później) jest wstydliwe.

Ale nauczyłem się mówić, że nie wiem, co to jest mnożenie. Tak, nie wiem, czym jest podalgebra w stosunku do algebry Liego. Tak, nie wiem, dlaczego równania kwadratowe są potrzebne w życiu. Swoją drogą, jeśli jesteś pewien, że wiesz, to mamy o czym rozmawiać! Matematyka to seria sztuczek. Matematycy próbują dezorientować i zastraszać opinię publiczną; gdzie nie ma zamieszania, nie ma reputacji, nie ma autorytetu. Tak, mówienie możliwie abstrakcyjnym językiem jest prestiżem, co jest kompletną bzdurą.

Czy wiesz, co to jest pochodna? Najprawdopodobniej powiesz mi o granicy stosunku różnicy. Na pierwszym roku matematyki i mechaniki na Uniwersytecie Państwowym w Petersburgu powiedział mi Wiktor Pietrowicz Chawin określony pochodna jako współczynnik pierwszego wyrazu szeregu Taylora funkcji w punkcie (była to osobna gimnastyka wyznaczania szeregu Taylora bez pochodnych). Długo się śmiałem z tej definicji, aż w końcu zrozumiałem, o co w niej chodzi. Pochodna to nic innego jak prosta miara tego, jak podobna jest funkcja, którą różniczkujemy, do funkcji y=x, y=x^2, y=x^3.

Teraz mam zaszczyt prowadzić wykłady dla studentów, którzy przestraszony matematyka. Jeśli boisz się matematyki, jesteśmy na tej samej ścieżce. Gdy tylko spróbujesz przeczytać jakiś tekst i wydaje Ci się, że jest on zbyt skomplikowany, to wiedz, że jest słabo napisany. Twierdzę, że nie ma takiego obszaru matematyki, którego nie da się omówić „na palcach” bez utraty dokładności.

Zadanie na najbliższą przyszłość: Poleciłem moim uczniom zrozumienie, czym jest liniowy regulator kwadratowy. Nie wstydź się, poświęć trzy minuty swojego życia i kliknij link. Jeśli niczego nie rozumiesz, oznacza to, że jesteśmy na tej samej ścieżce. Ja (zawodowy matematyk-programista) też nic nie rozumiałem. Zapewniam, że można to rozgryźć „na palcach”. W tej chwili nie wiem, co to jest, ale zapewniam, że uda nam się to rozgryźć.

Zatem pierwszy wykład, jaki wygłoszę moim studentom po tym, jak przybiegną do mnie z przerażeniem i powiedzą, że regulator liniowo-kwadratowy to straszna rzecz, której nigdy w życiu nie opanujecie, to metody najmniejszych kwadratów. Czy potrafisz rozwiązywać równania liniowe? Jeśli czytasz ten tekst, to najprawdopodobniej nie.

Zatem mając dane dwa punkty (x0, y0), (x1, y1), na przykład (1,1) i (3,2), zadaniem jest znalezienie równania prostej przechodzącej przez te dwa punkty:

ilustracja

Linia ta powinna mieć równanie podobne do poniższego:

Tutaj alfa i beta nie są nam znane, ale znane są dwa punkty tej linii:

Równanie to możemy zapisać w postaci macierzowej:

W tym miejscu należy dokonać lirycznej dygresji: czym jest matrix? Macierz to nic innego jak tablica dwuwymiarowa. Jest to sposób przechowywania danych i nie należy do niego przywiązywać żadnego innego znaczenia. Od nas zależy, jak dokładnie zinterpretujemy daną macierz. Okresowo będę to interpretował jako odwzorowanie liniowe, okresowo jako postać kwadratową, a czasami po prostu jako zbiór wektorów. Wszystko zostanie wyjaśnione w kontekście.

Zastąpmy konkretne macierze ich symboliczną reprezentacją:

Następnie (alfa, beta) można łatwo znaleźć:

Dokładniej dla naszych poprzednich danych:

Co prowadzi do następującego równania prostej przechodzącej przez punkty (1,1) i (3,2):

OK, tutaj wszystko jest jasne. Znajdźmy równanie prostej przechodzącej przez nią trzy punkty: (x0,y0), (x1,y1) i (x2,y2):

Och, och, och, ale mamy trzy równania z dwiema niewiadomymi! Zwykły matematyk powie, że nie ma rozwiązania. Co powie programista? I najpierw przepisze poprzedni układ równań w następującej formie:

W naszym przypadku wektory i, j, b są trójwymiarowe, dlatego (w ogólnym przypadku) ten układ nie ma rozwiązania. Dowolny wektor (alfa\*i + beta\*j) leży w płaszczyźnie rozpiętej przez wektory (i, j). Jeśli b nie należy do tej płaszczyzny, to nie ma rozwiązania (w równaniu nie można osiągnąć równości). Co robić? Szukajmy kompromisu. Oznaczmy przez e(alfa, beta) dokładnie, jak daleko nie osiągnęliśmy równości:

Postaramy się zminimalizować ten błąd:

Dlaczego kwadratowy?

Szukamy nie tylko minimum normy, ale także minimum kwadratu normy. Dlaczego? Sam punkt minimalny pokrywa się, a kwadrat daje funkcję gładką (funkcję kwadratową argumentów (alfa, beta)), natomiast sama długość daje funkcję w kształcie stożka, niezróżniczkowalną w punkcie minimalnym. Br. Kwadrat jest wygodniejszy.

Oczywiście błąd jest minimalizowany, gdy wektor mi prostopadłe do płaszczyzny rozpiętej na wektorach I I J.

Ilustracja

Innymi słowy: szukamy takiej prostej, aby suma kwadratów długości odległości wszystkich punktów od tej prostej była minimalna:

AKTUALIZACJA: Mam tutaj problem, odległość do linii prostej należy mierzyć w pionie, a nie w rzucie ortogonalnym. Ten komentator ma rację.

Ilustracja

Zupełnie innymi słowami (ostrożnie, słabo sformalizowany, ale powinno być jasne): bierzemy wszystkie możliwe linie pomiędzy wszystkimi parami punktów i szukamy średniej linii pomiędzy wszystkimi:

Ilustracja

Inne wyjaśnienie jest proste: dołączamy sprężynę pomiędzy wszystkimi punktami danych (tutaj mamy trzy) a linią prostą, której szukamy, a linia prosta stanu równowagi jest dokładnie tym, czego szukamy.

Minimalna forma kwadratowa

Biorąc pod uwagę ten wektor B oraz płaszczyzna rozpięta wektorami kolumnowymi macierzy A(w tym przypadku (x0,x1,x2) i (1,1,1)), szukamy wektora mi o minimalnej długości kwadratowej. Oczywiście minimum można osiągnąć tylko dla wektora mi, prostopadła do płaszczyzny rozpiętej przez wektory kolumnowe macierzy A:

Inaczej mówiąc, szukamy wektora x=(alfa, beta) takiego, że:

Przypomnę, że ten wektor x=(alfa, beta) jest minimum funkcji kwadratowej ||e(alfa, beta)||^2:

W tym miejscu warto pamiętać, że macierz można interpretować także w postaci kwadratowej, np. macierz jednostkowa ((1,0),(0,1)) można interpretować jako funkcję x^2 + y^ 2:

forma kwadratowa

Cała ta gimnastyka znana jest pod nazwą regresji liniowej.

Równanie Laplace'a z warunkiem brzegowym Dirichleta

Teraz najprostsze prawdziwe zadanie: istnieje pewna trójkątna powierzchnia, należy ją wygładzić. Na przykład załadujmy model mojej twarzy:

Oryginalne zatwierdzenie jest dostępne. Aby zminimalizować zależności zewnętrzne, wziąłem kod mojego oprogramowania renderującego, już na Habré. Do rozwiązania układu liniowego używam OpenNL, jest to doskonały solwer, który jednak jest bardzo trudny w instalacji: trzeba skopiować dwa pliki (.h+.c) do folderu z projektem. Całe wygładzanie odbywa się za pomocą następującego kodu:

Dla (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&twarz = twarze[i]; dla (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

Współrzędne X, Y i Z są rozłączne, wygładzam je oddzielnie. Oznacza to, że rozwiązuję trzy układy równań liniowych, każdy z liczbą zmiennych równą liczbie wierzchołków mojego modelu. W pierwszych n wierszach macierzy A znajduje się tylko jedna cyfra 1 w każdym wierszu, a pierwsze n wierszy wektora b ma oryginalne współrzędne modelu. Oznacza to, że wiążę sprężynę pomiędzy nową pozycją wierzchołka a starą pozycją wierzchołka - nowe nie powinny zbytnio oddalać się od starych.

We wszystkich kolejnych wierszach macierzy A (faces.size()*3 = liczba krawędzi wszystkich trójkątów w siatce) występuje jedno wystąpienie wartości 1 i jedno wystąpienie -1, przy czym wektor b ma przeciwne składowe zerowe. Oznacza to, że umieściłem sprężynę na każdej krawędzi naszej trójkątnej siatki: wszystkie krawędzie starają się uzyskać ten sam wierzchołek, co ich punkt początkowy i końcowy.

Jeszcze raz: wszystkie wierzchołki są zmienne i nie mogą oddalić się od swojego pierwotnego położenia, ale jednocześnie starają się upodobnić do siebie.

Oto wynik:

Wszystko byłoby w porządku, model rzeczywiście jest wygładzony, jednak odszedł od pierwotnej krawędzi. Zmieńmy trochę kod:

Dla (int i=0; tj<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

W naszej macierzy A dla wierzchołków znajdujących się na krawędzi dodaję nie wiersz z kategorii v_i = verts[i][d], ale 1000*v_i = 1000*verts[i][d]. Co to zmienia? A to zmienia naszą kwadratową postać błędu. Teraz pojedyncze odchylenie od góry przy krawędzi będzie kosztować nie jedną jednostkę, jak poprzednio, ale 1000*1000 jednostek. Oznacza to, że na skrajnych wierzchołkach zawiesiliśmy mocniejszą sprężynę, rozwiązanie będzie wolało mocniej naciągnąć pozostałe. Oto wynik:

Podwoimy siłę sprężyny między wierzchołkami:
nlWspółczynnik(twarz[j], 2); nlWspółczynnik(twarz[(j+1)%3], -2);

Logiczne jest, że powierzchnia stała się gładsza:

A teraz jeszcze sto razy silniejszy:

Co to jest? Wyobraź sobie, że zanurzyliśmy druciany pierścień w wodzie z mydłem. W rezultacie powstały film mydlany będzie starał się mieć jak najmniejszą krzywiznę, dotykając granicy - naszego drucianego pierścienia. Dokładnie to uzyskaliśmy ustalając brzeg i prosząc o gładką powierzchnię wewnątrz. Gratulacje, właśnie rozwiązaliśmy równanie Laplace'a z warunkami brzegowymi Dirichleta. Brzmi nieźle? Ale w rzeczywistości wystarczy rozwiązać jeden układ równań liniowych.

Równanie Poissona

Zapamiętajmy kolejną fajną nazwę.

Powiedzmy, że mam taki obraz:

Wszystkim się podoba, ale mi nie podoba się to krzesło.

Przetnę zdjęcie na pół:



I wybiorę krzesło własnymi rękami:

Następnie przeciągnę wszystko, co białe w masce na lewą stronę obrazu, a jednocześnie na całym obrazie powiem, że różnica między dwoma sąsiednimi pikselami powinna być równa różnicy między dwoma sąsiednimi pikselami po prawej stronie zdjęcie:

Dla (int i=0; tj

Oto wynik:

Dostępny kod i zdjęcia

Jeśli pewna wielkość fizyczna zależy od innej wielkości, wówczas zależność tę można zbadać, mierząc y przy różnych wartościach x. W wyniku pomiarów uzyskuje się szereg wartości:

x 1, x 2, ..., x i, ..., x n;

y 1 , y 2 , ..., y ja , ... , y n .

Na podstawie danych takiego eksperymentu można skonstruować wykres zależności y = ƒ(x). Otrzymana krzywa pozwala ocenić postać funkcji ƒ(x). Jednak stałe współczynniki, które wchodzą w skład tej funkcji, pozostają nieznane. Można je wyznaczyć metodą najmniejszych kwadratów. Punkty eksperymentalne z reguły nie leżą dokładnie na krzywej. Metoda najmniejszych kwadratów wymaga, aby suma kwadratów odchyleń punktów doświadczalnych od krzywej, tj. 2 był najmniejszy.

W praktyce metodę tę najczęściej (i najprościej) stosuje się w przypadku zależności liniowej, tj. Gdy

y = kx Lub y = a + bx.

Zależność liniowa jest bardzo rozpowszechniona w fizyce. A nawet gdy zależność jest nieliniowa, zazwyczaj próbują skonstruować wykres tak, aby otrzymać linię prostą. Przykładowo, jeśli przyjmiemy, że współczynnik załamania światła szkła n jest powiązany z długością fali światła λ zależnością n = a + b/λ 2, to na wykresie wykreślana jest zależność n od λ -2.

Rozważ zależność y = kx(linia prosta przechodząca przez początek). Skomponujmy wartość φ z sumy kwadratów odchyleń naszych punktów od prostej

Wartość φ jest zawsze dodatnia i okazuje się tym mniejsza, im bliżej prostej znajdują się nasze punkty. Metoda najmniejszych kwadratów zakłada, że ​​wartość k należy dobrać tak, aby φ posiadało minimum


Lub
(19)

Obliczenia pokazują, że błąd średniokwadratowy przy określaniu wartości k jest równy

, (20)
gdzie n jest liczbą pomiarów.

Rozważmy teraz nieco trudniejszy przypadek, gdy punkty muszą spełniać wzór y = a + bx(linia prosta, która nie przechodzi przez początek).

Zadanie polega na znalezieniu najlepszych wartości aib z dostępnego zbioru wartości x i, y i.

Utwórzmy ponownie postać kwadratową φ, równą sumie kwadratów odchyleń punktów x i, y i od prostej

i znajdź wartości aib, dla których φ ma minimum

;

.

.

Daje wspólne rozwiązanie tych równań

(21)

Pierwiastki średniokwadratowe błędów wyznaczania a i b są równe

(23)

.  (24)

Opracowując wyniki pomiarów tą metodą, wygodnie jest podsumować wszystkie dane w tabeli, w której wstępnie przeliczone zostaną wszystkie wielkości zawarte we wzorach (19)(24). Formy tych tabel podano w poniższych przykładach.

Przykład 1. Badano podstawowe równanie dynamiki ruchu obrotowego ε = M/J (prosta przechodząca przez początek układu współrzędnych). Przy różnych wartościach momentu M mierzono przyspieszenie kątowe ε pewnego ciała. Należy wyznaczyć moment bezwładności tego ciała. Wyniki pomiarów momentu siły i przyspieszenia kątowego zestawiono w kolumnach drugiej i trzeciej tabela 5.

Tabela 5
N M, Nm ε, s -1 M 2 M ε ε - kM (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Korzystając ze wzoru (19) wyznaczamy:

.

Aby wyznaczyć pierwiastek błędu średniokwadratowego, korzystamy ze wzoru (20)

0.005775kg-1 · M -2 .

Zgodnie ze wzorem (18) mamy

; .

S J = (2,996 0,005775)/0,3337 = 0,05185 kgm2.

Ustalając niezawodność P = 0,95, korzystając z tabeli współczynników Studenta dla n = 5, znajdujemy t = 2,78 i wyznaczamy błąd bezwzględny ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kgm2.

Zapiszmy wyniki w postaci:

J = (3,0 ± 0,2) kgm2;


Przykład 2. Obliczmy współczynnik temperaturowy oporu metalu metodą najmniejszych kwadratów. Opór zależy liniowo od temperatury

R t = R 0 (1 + α t°) = R 0 + R 0 α t°.

Wolny człon określa rezystancję R 0 w temperaturze 0 ° C, a współczynnik nachylenia jest iloczynem współczynnika temperaturowego α i rezystancji R 0 .

Wyniki pomiarów i obliczeń podano w tabeli ( patrz tabela 6).

Tabela 6
N t°, s r, Och t-¯t (t-¯t) 2 (t-¯t)r r - bt - a (r - bt - a) 2 ,10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Korzystając ze wzorów (21), (22) wyznaczamy

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Om.

Znajdźmy błąd w definicji α. Ponieważ , to zgodnie ze wzorem (18) mamy:

.

Korzystając ze wzorów (23), (24) mamy

;

0.014126 Om.

Ustalając niezawodność na P = 0,95, korzystając z tabeli współczynników Studenta dla n = 6, znajdujemy t = 2,57 i wyznaczamy błąd bezwzględny Δα = 2,57 0,000132 = 0,000338 stopień -1.

α = (23 ± 4) 10 -4 grad-1 przy P = 0,95.


Przykład 3. Wymagane jest określenie promienia krzywizny soczewki za pomocą pierścieni Newtona. Zmierzono promienie pierścieni Newtona r m i wyznaczono numery tych pierścieni m. Promienie pierścieni Newtona są powiązane z promieniem krzywizny soczewki R i liczbą pierścieni za pomocą równania

r 2 m = mλR - 2d 0 R,

gdzie d 0 grubość szczeliny między soczewką a płytką płasko-równoległą (lub odkształcenie soczewki),

λ długość fali padającego światła.

λ = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

wtedy równanie przyjmie postać y = a + bx.

.

Wyniki pomiarów i obliczeń są wpisywane tabela 7.

Tabela 7
N x = m y = r 2, 10 -2 mm 2 m -¯ m (m-¯m) 2 (m -¯ m)r y - bx - a, 10 -4 (y - bx - a) 2 , 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –

Jest szeroko stosowana w ekonometrii w postaci jasnej interpretacji ekonomicznej jej parametrów.

Regresja liniowa sprowadza się do znalezienia równania postaci

Lub

Równanie postaci pozwala na podstawie określonych wartości parametrów X mają teoretyczne wartości wynikowej charakterystyki, zastępując w niej rzeczywiste wartości współczynnika X.

Konstrukcja regresji liniowej sprowadza się do oszacowania jej parametrów - A I V. Oszacowania parametrów regresji liniowej można znaleźć różnymi metodami.

Klasyczne podejście do szacowania parametrów regresji liniowej opiera się na metoda najmniejszych kwadratów(MNC).

Metoda najmniejszych kwadratów pozwala na otrzymanie takich estymatorów parametrów A I V, przy czym suma kwadratów odchyleń rzeczywistych wartości wynikowej charakterystyki (y) z obliczonego (teoretycznego) minimum:

Aby znaleźć minimum funkcji, należy obliczyć pochodne cząstkowe każdego z parametrów A I B i ustaw je na zero.

Oznaczmy przez S, wówczas:

Przekształcając wzór, otrzymujemy następujący układ równań normalnych do szacowania parametrów A I V:

Rozwiązując układ równań normalnych (3.5) metodą sekwencyjnej eliminacji zmiennych lub metodą wyznaczników, znajdujemy wymagane oszacowania parametrów A I V.

Parametr V zwany współczynnikiem regresji. Jego wartość pokazuje średnią zmianę wyniku przy zmianie współczynnika o jedną jednostkę.

Równanie regresji jest zawsze uzupełniane wskaźnikiem bliskości połączenia. W przypadku stosowania regresji liniowej takim wskaźnikiem jest współczynnik korelacji liniowej. Istnieją różne modyfikacje wzoru na współczynnik korelacji liniowej. Niektóre z nich podano poniżej:

Jak wiadomo, współczynnik korelacji liniowej mieści się w granicach: -1 1.

Aby ocenić jakość wyboru funkcji liniowej, oblicza się kwadrat

Liniowy współczynnik korelacji tzw współczynnik determinacji. Współczynnik determinacji charakteryzuje proporcję wariancji wynikowej cechy y, wyjaśnione przez regresję, w całkowitej wariancji wynikowej cechy:

Zatem wartość 1 charakteryzuje udział wariancji y, spowodowane wpływem innych czynników nieuwzględnionych w modelu.

Pytania do samokontroli

1. Istota metody najmniejszych kwadratów?

2. Ile zmiennych dostarcza regresja parami?

3. Jaki współczynnik decyduje o bliskości powiązania pomiędzy zmianami?

4. W jakich granicach wyznacza się współczynnik determinacji?

5. Estymacja parametru b w analizie korelacji-regresji?

1. Christopher Dougherty. Wprowadzenie do ekonometrii. - M.: INFRA - M, 2001 - 402 s.

2. SA Borodich. Ekonometria. Mińsk LLC „Nowa wiedza” 2001.


3. RU Rachmetowa Krótki kurs ekonometrii. Instruktaż. Ałmaty. 2004. -78p.

4. I.I. Eliseeva Ekonometria. - M.: „Finanse i statystyka”, 2002

5. Miesięcznik informacyjno-analityczny.

Nieliniowe modele ekonomiczne. Modele regresji nieliniowej. Transformacja zmiennych.

Nieliniowe modele ekonomiczne..

Transformacja zmiennych.

Współczynnik elastyczności.

Jeśli istnieją nieliniowe zależności między zjawiskami gospodarczymi, wówczas wyraża się je za pomocą odpowiednich funkcji nieliniowych: na przykład hiperbola równoboczna , parabole drugiego stopnia itd.

Istnieją dwie klasy regresji nieliniowych:

1. Regresje nieliniowe w stosunku do zmiennych objaśniających uwzględnionych w analizie, ale liniowe w stosunku do oszacowanych parametrów, np.:

Wielomiany różnych stopni - , ;

Hiperbola równoboczna - ;

Funkcja semilogarytmiczna - .

2. Regresje, które są nieliniowe w szacowanych parametrach, na przykład:

Moc - ;

Demonstracyjne - ;

Wykładniczy - .

Całkowita suma kwadratów odchyleń poszczególnych wartości wynikowej charakterystyki Na od średniej wartości jest spowodowane wpływem wielu przyczyn. Warunkowo podzielmy cały zestaw powodów na dwie grupy: badany czynnik x I inne czynniki.

Jeśli czynnik nie ma wpływu na wynik, wówczas linia regresji na wykresie jest równoległa do osi Oh I

Wtedy cała wariancja wynikowej charakterystyki wynika z wpływu innych czynników, a całkowita suma kwadratów odchyleń będzie pokrywać się z resztą. Jeśli inne czynniki nie wpływają na wynik, to jesteś związany Z X funkcjonalnie, a reszta suma kwadratów wynosi zero. W tym przypadku suma kwadratów odchyleń wyjaśniona regresją jest taka sama, jak całkowita suma kwadratów.

Ponieważ nie wszystkie punkty pola korelacji leżą na linii regresji, ich rozproszenie zawsze następuje w wyniku wpływu czynnika X, czyli regresja Na Przez X, i spowodowane innymi przyczynami (niewyjaśniona zmienność). Przydatność linii regresji do prognozowania zależy od tego, jaka część całkowitej zmienności cechy Na wyjaśnia wyjaśnioną zmienność

Oczywiście, jeśli suma kwadratów odchyleń spowodowanych regresją jest większa niż suma kwadratów reszt, to równanie regresji jest istotne statystycznie i współczynnik X ma istotny wpływ na wynik ty

, tj. z liczbą swobody niezależnych zmian cechy. Liczba stopni swobody jest powiązana z liczbą jednostek populacji n i liczbą wyznaczonych z niej stałych. W odniesieniu do badanego problemu liczba stopni swobody powinna wskazywać, od ilu niezależnych odchyleń P

Ocenę znaczenia równania regresji jako całości podano za pomocą F-Kryterium Fishera. W tym przypadku stawia się hipotezę zerową, że współczynnik regresji jest równy zeru, tj. b = 0, a zatem współczynnik X nie ma wpływu na wynik ty

Natychmiastowe obliczenie testu F poprzedzone jest analizą wariancji. Centralne miejsce w nim zajmuje rozkład całkowitej sumy kwadratów odchyleń zmiennej Na od wartości średniej Na na dwie części – „wyjaśnioną” i „niewyjaśnioną”:

- całkowita suma kwadratów odchyleń;

- suma kwadratów odchyleń wyjaśnionych regresją;

- resztowa suma kwadratów odchyleń.

Dowolna suma kwadratów odchyleń jest powiązana z liczbą stopni swobody , tj. z liczbą swobody niezależnych zmian cechy. Liczba stopni swobody jest powiązana z liczbą jednostek populacji N i z wyznaczoną na tej podstawie liczbą stałych. W odniesieniu do badanego problemu liczba stopni swobody powinna wskazywać, od ilu niezależnych odchyleń P wymagane do utworzenia danej sumy kwadratów.

Dyspersja na stopień swobodyD.

Współczynniki F (test F):

Jeśli hipoteza zerowa jest prawdziwa, to wariancja czynnikowa i resztowa nie różnią się od siebie. W przypadku H 0 konieczne jest obalenie, aby dyspersja współczynników kilkakrotnie przekraczała dyspersję resztkową. Angielski statystyk Snedekor opracował tablice wartości krytycznych F-zależności na różnych poziomach istotności hipotezy zerowej i różnych liczbach stopni swobody. Wartość tabeli F-kryterium to maksymalna wartość stosunku wariancji, jaka może wystąpić w przypadku rozbieżności losowej dla danego poziomu prawdopodobieństwa wystąpienia hipotezy zerowej. Obliczona wartość F-relacje uważa się za wiarygodne, jeśli o jest większe niż w tabeli.

W tym przypadku hipoteza zerowa o braku związku między znakami zostaje odrzucona i wyciągany jest wniosek na temat znaczenia tego związku: Fakt F > tabela F H0 zostaje odrzucony.

Jeśli wartość jest mniejsza niż w tabeli Fakt F ‹, tabela F, to prawdopodobieństwo hipotezy zerowej jest wyższe od określonego poziomu i nie można jej odrzucić bez poważnego ryzyka wyciągnięcia błędnego wniosku o istnieniu związku. W tym przypadku równanie regresji uważa się za nieistotne statystycznie. Ale on nie odbiega.

Błąd standardowy współczynnika regresji

Aby ocenić istotność współczynnika regresji, porównuje się jego wartość z błędem standardowym, czyli wyznacza się wartość rzeczywistą T-Test studenta: którą następnie porównuje się z wartością z tabeli na określonym poziomie istotności i liczbie stopni swobody ( N- 2).

Standardowy błąd parametru A:

Istotność współczynnika korelacji liniowej sprawdza się na podstawie wielkości błędu Współczynnik korelacji t r:

Całkowita wariancja cechy X:

Wielokrotna regresja liniowa

Budowa modelu

Regresja wielokrotna reprezentuje regresję efektywnej cechy z dwoma lub więcej czynnikami, tj. modelem postaci

Regresja może dać dobre wyniki w modelowaniu, jeśli pominąć wpływ innych czynników wpływających na przedmiot badań. Zachowania poszczególnych zmiennych ekonomicznych nie da się kontrolować, tzn. nie da się zapewnić równości wszystkich pozostałych warunków oceny wpływu jednego badanego czynnika. W takim przypadku należy spróbować zidentyfikować wpływ innych czynników, wprowadzając je do modelu, czyli skonstruować równanie regresji wielokrotnej: y = a+b 1 x 1 +b 2 +…+b p x p + .

Głównym celem regresji wielokrotnej jest zbudowanie modelu z dużą liczbą czynników, przy jednoczesnym określeniu wpływu każdego z nich z osobna, a także ich łącznego wpływu na modelowany wskaźnik. Specyfikacja modelu obejmuje dwa zakresy zagadnień: dobór czynników oraz wybór rodzaju równania regresji