Yaklaşım tahminlerinin ortalama bağıl hatası. Fisher's F testi kullanılarak regresyon modelleme sonuçlarının istatistiksel güvenilirliğinin tahmini

Bölge bölgeleri için 200X'e ait veriler sağlanmaktadır.

Bölge numarası Sağlıklı bir kişinin günlük kişi başına ortalama geçim ücreti, rub., x Ortalama günlük ücret, rub., y
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

Egzersiz yapmak:

1. Bir korelasyon alanı oluşturun ve bağlantının şekli hakkında bir hipotez formüle edin.

2. Doğrusal regresyon denkleminin parametrelerini hesaplayın

4. Ortalama (genel) esneklik katsayısını kullanarak, faktör ile sonuç arasındaki ilişkinin gücüne ilişkin karşılaştırmalı bir değerlendirme yapın.

7. Faktörün tahmin değeri ortalama seviyesinden %10 oranında artarsa ​​sonucun tahmin değerini hesaplayınız. Önem düzeyi için tahmin güven aralığını belirleyin.

Çözüm:

Bu sorunu Excel kullanarak çözelim.

1. Mevcut x ve y verilerini karşılaştırarak, örneğin bunları x faktörünün artan sırasına göre sıralayarak, kişi başına düşen ortalama geçim seviyesindeki bir artış günlük ortalamayı arttırdığında, özellikler arasında doğrudan bir ilişkinin varlığı gözlemlenebilir. maaş. Buna dayanarak, özellikler arasındaki ilişkinin doğrudan olduğu ve düz bir çizgi denklemiyle tanımlanabileceği varsayımında bulunabiliriz. Aynı sonuç grafiksel analize dayanarak da doğrulanmaktadır.

Bir korelasyon alanı oluşturmak için Excel PPP'yi kullanabilirsiniz. Başlangıç ​​verilerini sırayla girin: önce x, sonra y.

Veri içeren hücrelerin alanını seçin.

Ardından şunu seçin: Ekle / Dağılım Grafiği / İşaretçilerle DağılımŞekil 1'de gösterildiği gibi.

Şekil 1 Korelasyon alanının yapısı

Korelasyon alanının analizi, noktalar neredeyse düz bir çizgide yer aldığından doğrusala yakın bir bağımlılığın varlığını gösterir.

2. Doğrusal regresyon denkleminin parametrelerini hesaplamak
Yerleşik istatistiksel işlevi kullanalım DÜZ.

Bunu yapmak için:

1) Analiz edilen verileri içeren mevcut bir dosyayı açın;
2) Regresyon istatistiklerinin sonuçlarını görüntülemek için 5x2'lik boş hücre alanını (5 satır, 2 sütun) seçin.
3) Etkinleştir İşlev Sihirbazı: ana menüde seçin Formüller / Ekleme İşlevi.
4) Pencerede Kategori seçmek İstatistiksel, işlev penceresinde - DÜZ. Düğmeye tıklayın TAMAMŞekil 2'de gösterildiği gibi;

Şekil 2 İşlev Sihirbazı İletişim Kutusu

5) Fonksiyon argümanlarını doldurun:

Bilinen değerler

X'in bilinen değerleri

Devamlı- denklemde serbest bir terimin varlığını veya yokluğunu gösteren mantıksal bir değer; Sabit = 1 ise serbest terim olağan şekilde hesaplanır, Sabit = 0 ise serbest terim 0'dır;

İstatistikler- regresyon analizine ilişkin ek bilgilerin görüntülenip görüntülenmeyeceğini belirten mantıksal bir değer. İstatistik = 1 ise ek bilgiler görüntülenir, İstatistik = 0 ise yalnızca denklem parametrelerinin tahminleri görüntülenir.

Düğmeye tıklayın TAMAM;

Şekil 3 LINEST Fonksiyon Bağımsız Değişkenleri İletişim Kutusu

6) Final masasının ilk elemanı seçilen alanın sol üst hücresinde görünecektir. Tablonun tamamını açmak için düğmeye basın ve ardından tuş kombinasyonuna ++ .

Ek regresyon istatistikleri aşağıdaki diyagramda gösterilen sıraya göre yayınlanacaktır:

Katsayı değeri b Bir değerin katsayısı
Standart hata b Standart hata a
Standart hata y
F istatistiği
Regresyon kareler toplamı

Şekil 4 DOT fonksiyonunu hesaplamanın sonucu

Regresyon seviyesini elde ettik:

Sonuç olarak: Kişi başına düşen ortalama geçim seviyesinde 1 ruble artışla. ortalama günlük ücret ortalama 0,92 ruble artıyor.

Bu, ücretlerdeki (y) değişimin %52'sinin x faktörünün (kişi başına ortalama geçim ücreti) değişimiyle ve %48'inin modele dahil edilmeyen diğer faktörlerin etkisiyle açıklandığı anlamına gelir.

Hesaplanan belirleme katsayısı kullanılarak korelasyon katsayısı hesaplanabilir: .

Bağlantı yakın olarak değerlendirilir.

4. Ortalama (genel) esneklik katsayısını kullanarak faktörün sonuç üzerindeki etkisinin gücünü belirleriz.

Düz bir çizgi denklemi için ortalama (toplam) esneklik katsayısını aşağıdaki formülü kullanarak belirleriz:

X değerlerine sahip hücrelerin alanını seçip seçerek ortalama değerleri bulacağız. Formüller / Otomatik Toplam / Ortalama ve aynısını y'nin değerleriyle de yapacağız.

Şekil 5 Ortalama fonksiyon değerlerinin ve argümanının hesaplanması

Yani kişi başına düşen ortalama yaşam maliyeti ortalama değerinden %1 oranında değişirse ortalama günlük ücret ortalama %0,51 oranında değişecektir.

Bir veri analizi aracı kullanma Regresyonşunları alabilirsiniz:
- regresyon istatistiklerinin sonuçları,
- varyans analizinin sonuçları,
- güven aralıklarının sonuçları,
- artıklar ve regresyon çizgisi uydurma grafikleri,
- artıklar ve normal olasılık.

Prosedür aşağıdaki gibidir:

1) erişimi kontrol edin Analiz paketi. Ana menüde şunu seçin: Dosya/Seçenekler/Eklentiler.

2) Açılır listede Kontrolöğe seç Excel eklentileri ve düğmeye basın Gitmek.

3) Pencerede Eklentiler kutuyu işaretleyin Analiz paketi ve ardından düğmeye tıklayın TAMAM.

Eğer Analiz paketi alan listesinde yok Mevcut eklentiler, düğmeye basın Gözden geçirmek Bir arama gerçekleştirmek için.

Analiz paketinin bilgisayarınızda yüklü olmadığını belirten bir mesaj alırsanız tıklayın. Evet yüklemek için.

4) Ana menüde şunu seçin: Veri / Veri Analizi / Analiz Araçları / Regresyon ve ardından düğmeye tıklayın TAMAM.

5) Veri giriş ve çıkış parametreleri iletişim kutusunu doldurun:

Giriş aralığı Y- sonuç niteliğinin verilerini içeren aralık;

Giriş aralığı X- faktör karakteristiğinin verilerini içeren aralık;

Etiketler- ilk satırın sütun adlarını içerip içermediğini gösteren bir işaret;

Sabit - sıfır- denklemde serbest bir terimin varlığını veya yokluğunu gösteren bir işaret;

Çıkış aralığı- gelecekteki aralığın sol üst hücresini belirtmek yeterlidir;

6) Yeni çalışma sayfası - yeni sayfa için isteğe bağlı bir ad belirleyebilirsiniz.

Daha sonra düğmeye tıklayın TAMAM.

Şekil 6 Regresyon aracına ilişkin parametrelerin girilmesine yönelik iletişim kutusu

Problem verilerine ilişkin regresyon analizi sonuçları Şekil 7'de sunulmaktadır.

Şekil 7 Regresyon aracını kullanmanın sonucu

5. Ortalama yaklaşım hatasını kullanarak denklemlerin kalitesini değerlendirelim. Şekil 8'de sunulan regresyon analizinin sonuçlarını kullanalım.

Şekil 8 “Kalanların Çekilmesi” regresyon aracının kullanılmasının sonucu

Şekil 9'da gösterildiği gibi yeni bir tablo oluşturalım. C sütununda bağıl yaklaşım hatasını aşağıdaki formülü kullanarak hesaplıyoruz:

Şekil 9 Ortalama yaklaşım hatasının hesaplanması

Ortalama yaklaşım hatası aşağıdaki formül kullanılarak hesaplanır:

Oluşturulan modelin kalitesi %8 - 10'u geçmediğinden iyi olarak değerlendirilmektedir.

6. Regresyon istatistiklerini içeren tablodan (Şekil 4) Fisher'in F testinin gerçek değerini yazıyoruz:

O zamandan beri %5 anlamlılık düzeyinde, regresyon denkleminin anlamlı olduğu sonucuna varabiliriz (ilişki kanıtlanmıştır).

8. Regresyon parametrelerinin istatistiksel anlamlılığını, Öğrenci t istatistiklerini kullanarak ve her göstergenin güven aralığını hesaplayarak değerlendireceğiz.

Göstergeler ile sıfır arasındaki istatistiksel olarak önemsiz bir fark hakkında H 0 hipotezini öne sürdük:

.

serbestlik derecesi sayısı için

Şekil 7'de gerçek t-istatistik değerleri verilmiştir:

Korelasyon katsayısı için t testi iki şekilde hesaplanabilir:

Yöntem I:

Nerede - korelasyon katsayısının rastgele hatası.

Hesaplama için verileri Şekil 7'deki tablodan alacağız.

Yöntem II:

Gerçek t-istatistik değerleri tablo değerlerini aşıyor:

Bu nedenle H 0 hipotezi reddedilir, yani regresyon parametreleri ve korelasyon katsayısı tesadüfen sıfırdan farklı değildir, ancak istatistiksel olarak anlamlıdır.

a parametresi için güven aralığı şu şekilde tanımlanır:

a parametresi için Şekil 7'de gösterilen %95 limitleri şöyleydi:

Regresyon katsayısı için güven aralığı şu şekilde tanımlanır:

Regresyon katsayısı b için Şekil 7'de gösterilen %95 limitleri şöyleydi:

Güven aralıklarının üst ve alt sınırlarının analizi, olasılık ile şu sonuca varmaktadır: a ve b parametreleri belirtilen sınırlar dahilinde olduğundan sıfır değer almaz; istatistiksel olarak anlamsız değildir ve sıfırdan önemli ölçüde farklı değildir.

7. Regresyon denkleminin elde edilen tahminleri, onun tahmin için kullanılmasına olanak tanır. Tahmin edilen yaşam maliyeti ise:

O zaman yaşam maliyetinin tahmin edilen değeri şöyle olacaktır:

Tahmin hatasını aşağıdaki formülü kullanarak hesaplıyoruz:

Nerede

Ayrıca Excel PPP'yi kullanarak varyansı da hesaplayacağız. Bunu yapmak için:

1) Etkinleştir İşlev Sihirbazı: ana menüde seçin Formüller / Ekleme İşlevi.

3) Faktör karakteristiğinin sayısal verilerini içeren aralığı doldurun. Tıklamak TAMAM.

Şekil 10 Varyansın hesaplanması

Varyans değerini aldık

Serbestlik derecesi başına artık varyansı hesaplamak için Şekil 7'de gösterildiği gibi varyans analizinin sonuçlarını kullanacağız.

Y'nin bireysel değerlerini 0,95 olasılıkla tahmin etmek için güven aralıkları şu ifadeyle belirlenir:

Aralık, öncelikle gözlem hacminin küçük olması nedeniyle oldukça geniştir. Genel olarak ortalama aylık maaş tahmininin güvenilir olduğu ortaya çıktı.

Sorun ifadesi şu kaynaktan alınmıştır: Workshop on Econometrics: Proc. ödenek / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko ve diğerleri; Ed. I.I. Eliseeva. - M .: Finans ve İstatistik, 2003. - 192 s .: hasta.

5. F testi kullanılarak, ortaya çıkan ikili regresyon denkleminin bir bütün olarak istatistiksel olarak anlamsız olduğu ve aylık emeklilik değeri y ile yaşam maliyeti x arasındaki ilişkiye ilişkin incelenen olguyu yeterince tanımlamadığı tespit edildi.

6. Koşullu bir firmanın net gelir miktarını y ile sermaye cirosu x1 ve kullanılan sermaye x2 ile ilişkilendiren ekonometrik çoklu doğrusal regresyon modeli oluşturulmuştur.

7. Esneklik katsayıları hesaplanarak sermaye devir hızı %1 değiştiğinde şirketin net kâr miktarının %0,0008 değiştiği, kullanılan sermaye %1 değiştiğinde şirketin net kâr miktarının değiştiği gösterilmiştir. %0,56 oranında değişti.

8. T testi kullanılarak regresyon katsayılarının istatistiksel anlamlılığı değerlendirildi. Açıklayıcı değişken x 1'in istatistiksel olarak anlamlı olmadığı ve regresyon denkleminin dışında tutulabileceği, aynı zamanda açıklayıcı değişken x 2'nin ise istatistiksel olarak anlamlı olduğu bulundu. istatistiksel olarak anlamlı.

9. F testi kullanılarak, ortaya çıkan ikili regresyon denkleminin bir bütün olarak istatistiksel olarak anlamlı olduğu ve koşullu bir firmanın net geliri y ile sermaye cirosu x 1 ve kullanılan sermaye arasındaki ilişkiye ilişkin incelenen olguyu yeterince tanımladığı tespit edilmiştir. x 2.

10. İstatistiksel verilere doğrusal çoklu regresyon denklemi ile ortalama yaklaşım hatası hesaplandı ve bu da %29,8'e ulaştı. İstatistiksel veritabanındaki hangi gözlem nedeniyle bu hatanın büyüklüğünün izin verilen değeri aştığı gösterilmiştir.

14. EXCEL kullanmadan eşleştirilmiş regresyon modelinin oluşturulması.

Tablo 3.5'te verilen istatistiksel materyali kullanarak şunları yapmak gerekir:

2. Korelasyon ve kararlılık göstergelerini kullanarak bağlantının yakınlığını değerlendirin.

3.Esneklik katsayısını kullanarak faktör karakteristiği ile sonuç karakteristiği arasındaki bağlantının derecesini belirleyin.

4. Ortalama yaklaşım hatasını belirleyin.

5.Fisher's F-testini kullanarak modellemenin istatistiksel güvenilirliğini değerlendirin.

Tablo 3.5. Başlangıç ​​verileri.

Mevduat, kredi, sertifika tasarruflarını artırmaya ve döviz alımına yönelik nakit gelirlerinin kişi başına düşen ortalama nakit gelir toplamı içindeki payı, %

Ortalama aylık tahakkuk eden ücretler, c.u.

Kaluzhskaya

Kostromskaya

Orlovskaya

Ryazan

Smolenskaya

Eşleştirilmiş doğrusal regresyon denkleminin bilinmeyen parametrelerini belirlemek için b 0 , b 1, şu şekilde olan standart normal denklem sistemini kullanırız:

(3.7)

Bu sistemi çözmek için öncelikle Sx 2 ve Sxy değerlerinin belirlenmesi gerekmektedir. Bu değerler kaynak veri tablosundan uygun sütunlarla desteklenerek belirlenir (Tablo 3.6).

Tablo 3.6. Regresyon katsayılarının hesaplanmasına yönelik.

Daha sonra sistem (3.7) formunu alır

İlk denklemden b 0'ı ifade edersek ve elde edilen ifadeyi ikinci denklemde yerine koyarsak şunu elde ederiz:

Terim terim çarpma işlemini gerçekleştirip parantezleri açarsak şunu elde ederiz:

Son olarak, tasarrufları artırmayı amaçlayan nüfusun nakit gelir payının değerini y ile aylık tahakkuk eden ortalama ücret x'i birleştiren ikili doğrusal regresyon denklemi şu şekildedir:

Böylece, eşleştirilmiş doğrusal regresyon denklemi oluşturulurken bağımlılığa göre doğrusal korelasyon katsayısını belirleriz:

karşılık gelen parametrelerin standart sapmalarının değerleri nerede.

Bağımlılıktan (3.9) doğrusal korelasyon katsayısını hesaplamak için ara hesaplamalar yaparız.

Bulunan parametrelerin değerlerini ifade (3.9) ile değiştirerek elde ederiz

.

Doğrusal korelasyon katsayısının elde edilen değeri, nüfusun tasarrufları artırmaya yönelik nakit gelirinin payı y ile tahakkuk eden ortalama aylık ücret miktarı x arasında zayıf bir ters istatistiksel ilişkinin varlığını göstermektedir.

Belirleme katsayısı , yani açıklayıcı değişken x'in y üzerinde regresyonuyla yalnızca %9,6'nın açıklandığı anlamına gelir. Buna göre %90,4'e eşit olan 1 değeri, ekonometrik modelde dikkate alınmayan diğer tüm açıklayıcı değişkenlerin etkisinden kaynaklanan y değişkeninin varyansının payını karakterize etmektedir.

Esneklik katsayısı

Sonuç olarak, ortalama aylık tahakkuk eden ücret %1 değiştiğinde nüfusun tasarrufları artırmaya yönelik nakit gelirinden aldığı pay da %1 azalmakta, ücretlerdeki artışla birlikte nüfusun nakit gelirinden aldığı payda da azalma olmaktadır. Nüfus tasarruflarını artırmayı hedefliyor. Bu sonuç sağduyuya aykırıdır ve yalnızca oluşturulan matematiksel modelin yanlışlığıyla açıklanabilir.

Ortalama yaklaşım hatasını hesaplayalım.

Tablo 3.7. Ortalama yaklaşım hatasının hesaplanmasına doğru.

Elde edilen değer %(12...15)'i aşmaktadır; bu, hesaplanan verilerin, ekonometrik modelin oluşturulduğu gerçek verilerden ortalama sapmasının önemini göstermektedir.

İstatistiksel modellemenin güvenilirliği Fisher'in F-testine dayalı olarak gerçekleştirilecektir. Fisher kriteri F hesaplamasının teorik değeri, faktör değerlerinin ve formüle göre bir serbestlik derecesi için hesaplanan artık dağılımların oranından belirlenir.

burada n gözlem sayısıdır;

m açıklayıcı değişkenlerin sayısıdır (göz önünde bulundurulan örnek için m m =1).

Kritik değer F kritik istatistiksel tablolardan belirlenir ve anlamlılık düzeyi için a = 0,05, 10,13'e eşittir. F hesaplandığından beri

15. EXCEL kullanmadan çoklu regresyon modelinin oluşturulması.

Tablo 3.8'de verilen istatistiksel materyali kullanarak şunları yapmalısınız:

1. Doğrusal çoklu regresyon denklemi oluşturun ve parametrelerinin ekonomik anlamını açıklayın.

2. Ortalama (genel) esneklik katsayılarını kullanarak, faktörler ile ortaya çıkan nitelik arasındaki ilişkinin yakınlığının karşılaştırmalı bir değerlendirmesini yapın.

3. Regresyon katsayılarının istatistiksel anlamlılığını t-testini kullanarak ve denklemin anlamlı olmadığına ilişkin boş hipotezi F-testini kullanarak değerlendirin.

4. Ortalama yaklaşım hatasını belirleyerek denklemin kalitesini değerlendirin.

Tablo 3.8. Başlangıç ​​verileri.

Net gelir, milyon ABD doları

Sermaye cirosu milyon ABD doları

Kullanılan sermaye, milyon ABD doları

Çoklu doğrusal regresyon denkleminin bilinmeyen parametrelerini belirlemek için b 0 , b 1 , b 2, şu forma sahip olan standart normal denklem sistemini kullanırız:

(3.11)

Bu sistemi çözmek için öncelikle Sx 1 2, Sx 2 2, Sx 1 y, Sx 2 y, Sx 1 x 2 değerlerinin belirlenmesi gerekmektedir. Bu değerler kaynak veri tablosundan uygun sütunlarla desteklenerek belirlenir (Tablo 3.9).

Tablo 3.9. Regresyon katsayılarının hesaplanmasına yönelik.

Daha sonra sistem (3.11) formunu alır

Bu sistemi çözmek için bilinmeyenleri sırayla elemeyi içeren Gauss yöntemini kullanacağız: sistemin ilk denklemini 10'a bölün, ardından elde edilen denklemi 370,6 ile çarpın ve sistemin ikinci denkleminden çıkarın, ardından elde edilen sonucu çarpın elde edilen denklemi 158.20 ile hesaplayın ve onu sistemin üçüncü denkleminden çıkarın. Belirtilen algoritmayı sistemin dönüştürülmüş ikinci ve üçüncü denklemleri için tekrarlayarak şunu elde ederiz:

Þ Þ

Þ .

Dönüşümden sonra elimizde:

O zaman net gelirin sermaye devrine ve doğrusal çoklu regresyon denklemi biçiminde kullanılan sermayeye nihai bağımlılığı şu şekildedir:

Ortaya çıkan ekonometrik denklemden, kullanılan sermayedeki artışla net gelirin arttığı ve bunun tersine, sermaye devir hızındaki artışla net gelirin azaldığı açıktır. Ayrıca regresyon katsayısı ne kadar büyük olursa, açıklayıcı değişkenin bağımlı değişken üzerindeki etkisi de o kadar büyük olur. Söz konusu örnekte, regresyon katsayısının değeri katsayı değerinden daha büyüktür, dolayısıyla kullanılan sermayenin net gelir üzerinde sermaye devrinden önemli ölçüde daha büyük bir etkisi vardır. Bu sonucu ölçmek için kısmi esneklik katsayılarını belirleyeceğiz.

Sonuçların analizi ayrıca kullanılan sermayenin net gelir üzerinde daha büyük bir etkiye sahip olduğunu göstermektedir. Yani özellikle kullanılan sermayenin %1 oranında artmasıyla net kâr %1,17 oranında artıyor. Aynı zamanda sermaye devir hızının %1 oranında artmasıyla net kâr da %0,5 oranında azalmaktadır.

Fisher kriteri F'nin teorik değeri hesaplandı.

Kritik değer F crit'in değeri istatistiksel tablolardan belirlenir ve a = 0,05 anlamlılık düzeyi için 4,74'e eşittir. F calc > F crit olduğundan sıfır hipotezi reddedilir ve ortaya çıkan regresyon denklemi istatistiksel olarak anlamlı kabul edilir.

Regresyon katsayılarının ve t kriterinin istatistiksel öneminin değerlendirilmesi, bu katsayıların sayısal değerinin rastgele hatalarının büyüklüğüyle ve ilişkiye göre karşılaştırılmasına gelir:

T-istatistiklerinin teorik değerini hesaplamak için çalışma formülü şöyledir:

, (3.13)

burada çift korelasyon katsayıları ve çoklu korelasyon katsayısı bağımlılıklardan hesaplanır:

Daha sonra t istatistiklerinin teorik (hesaplanan) değerleri sırasıyla şuna eşittir:

Anlamlılık seviyesi a = 0,05 ve t crit = 2,36 için istatistiksel tablolardan belirlenen t-istatistiklerinin kritik değeri, mutlak değer olarak = - 1,798'den büyük olduğundan, sıfır hipotezi reddedilmez ve açıklayıcı değişken x 1 olur. istatistiksel olarak anlamsızdır ve regresyon denkleminin dışında tutulabilir. Tersine, ikinci regresyon katsayısı için > t kritik (3,3 > 2,36) ve açıklayıcı değişken x 2 istatistiksel olarak anlamlıdır.

Ortalama yaklaşım hatasını hesaplayalım.

Tablo 3.10. Ortalama yaklaşım hatasının hesaplanmasına doğru.

O zaman ortalama yaklaşım hatası

Elde edilen değer, %(12…15)'e eşit izin verilen sınırı aşmıyor.

16. Ölçme teorisinin gelişim tarihi

TI ilk olarak psikofiziksel ölçümlerin bir teorisi olarak geliştirildi. Savaş sonrası yayınlarda Amerikalı psikolog S.S. Stevens ölçüm ölçeklerine odaklandı. 20. yüzyılın ikinci yarısında. TI'nin uygulama kapsamı hızla genişliyor. 50'li yıllarda ABD'de yayınlanan “Psikolojik Bilimler Ansiklopedisi”nin ciltlerinden birinin adı “Psikolojik Ölçümler” idi. Bu yayının yazarları TI'nin kapsamını genel olarak psikofizikten psikolojiye kadar genişletti. Bu koleksiyondaki "Ölçüm Teorisinin Temelleri" başlıklı makalede sunum, herhangi bir spesifik uygulama alanına atıfta bulunulmadan soyut matematiksel düzeydeydi. İçinde, "sayısal olanlarla ilişkileri olan ampirik sistemlerin homomorfizmleri" (burada bu matematiksel terimlere girmeye gerek yok) vurgu yapıldı ve sunumun matematiksel karmaşıklığı, S.S. Stevens.

TI ile ilgili ilk yerli makalelerden birinde (60'ların sonu), uzmanlar tarafından inceleme nesnelerini değerlendirirken verilen puanların kural olarak sıralı bir ölçekte ölçüldüğü tespit edilmiştir. 70'lerin başında ortaya çıkan çalışmalar, TI kullanım kapsamının önemli ölçüde genişlemesine yol açtı. Pedagojik nitelik (öğrencilerin bilgi kalitesinin ölçülmesi), sistem araştırmalarında, uzman değerlendirme teorisinin çeşitli problemlerinde, ürün kalite göstergelerinin toplanmasında, sosyolojik çalışmalarda vb. uygulanmıştır.

TI'nin iki ana sorunu olarak, belirli verileri ölçmek için ölçek tipinin belirlenmesinin yanı sıra, sonucu ölçeğin kabul edilebilir herhangi bir dönüşümüyle değişmeyen (yani, zamana göre değişmez) veri analizi algoritmaları için bir araştırma ortaya konmuştur. Coğrafyadaki sıra ölçekleri Beaufort ölçeği rüzgarları (“sakin”, “hafif rüzgar”, “orta rüzgar” vb.), deprem şiddeti ölçeğidir. Açıkçası 2 büyüklüğündeki bir depremin (tavan altında sallanan bir lamba), 10 büyüklüğündeki bir depremden (yeryüzünde her şeyin tamamen yok olması) tam olarak 5 kat daha zayıf olduğu söylenemez.

Tıpta sıralı ölçekler, hipertansiyonun aşamalarının ölçeği (Myasnikov'a göre), kalp yetmezliği derecelerinin ölçeği (Strazhesko-Vasilenko-Lang'a göre), koroner yetmezliğin ciddiyetinin ölçeği (Fogelson'a göre), vb. . Tüm bu ölçekler şu şemaya göre oluşturulmuştur: hiçbir hastalık tespit edilmemiştir; hastalığın ilk aşaması; ikinci aşama; üçüncü aşama... Bazen 1a, 16 vb. aşamalar ayırt edilir. Her aşamanın kendine özgü bir tıbbi özelliği vardır. Engelli grupları açıklanırken rakamlar tam tersi şekilde kullanılmaktadır: En ağır olanı birinci engelli grubu, ardından ikinci, en hafifi ise üçüncü engelli grubudur.

Ev numaraları da sıralı ölçekte ölçülür; evlerin cadde boyunca hangi sırayla yerleştirildiğini gösterir. Bir yazarın derlenmiş eserlerindeki cilt numaraları veya bir kurumsal arşivdeki vaka numaraları genellikle bunların yaratılışındaki kronolojik sıra ile ilişkilendirilir.

Ürün ve hizmetlerin kalitesini değerlendirirken, qualimetri (literatür çeviri - kalite ölçümü) adı verilen yöntemde sıralı ölçekler popülerdir. Yani bir üretim birimi yeterli veya uygun değil olarak değerlendirilir. Daha kapsamlı bir analiz için üç dereceli bir ölçek kullanılır: önemli kusurlar vardır - yalnızca küçük kusurlar vardır - kusur yoktur. Bazen dört derecelendirme kullanılır: kritik kusurlar vardır (kullanımı imkansız hale getirir) - önemli kusurlar vardır - yalnızca küçük kusurlar vardır - kusur yoktur. Ürünlerin derecelendirilmesinin de benzer bir anlamı vardır: birinci sınıf, birinci sınıf, ikinci sınıf,...

Çevresel etkileri değerlendirirken ilk ve en genel değerlendirme genellikle sıralıdır; örneğin: doğal çevre stabildir - doğal çevre baskı altındadır (bozulmuştur). Çevresel-tıbbi ölçek benzerdir: İnsan sağlığı üzerinde belirgin bir etki yoktur - sağlık üzerinde olumsuz bir etki kaydedilmiştir.

Sıralı ölçek diğer alanlarda da kullanılır. Ekonometride bunlar öncelikle çeşitli uzman değerlendirme yöntemleridir.

Tüm ölçüm ölçekleri iki gruba ayrılır - niteliksel özellik ölçekleri ve niceliksel özellik ölçekleri. Sıralı ölçek ve adlandırma ölçeği, niteliksel niteliklerin ana ölçekleridir, dolayısıyla birçok spesifik alanda nitel analizin sonuçları, bu ölçeklerdeki ölçümler olarak düşünülebilir. Niceliksel özelliklerin ölçekleri aralıkların, oranların, farklılıkların ve mutlakların ölçekleridir. Aralık ölçeği kullanılarak potansiyel enerjinin büyüklüğü veya düz bir çizgi üzerindeki bir noktanın koordinatı ölçülür. Bu durumlarda ne doğal köken ne de doğal ölçü birimi ölçekte işaretlenebilir. Araştırmacı başlangıç ​​noktasını belirlemeli ve ölçü birimini kendisi seçmelidir. Aralık ölçeğinde kabul edilebilir dönüşümler doğrusal artan dönüşümlerdir; doğrusal fonksiyonlar. Celsius ve Fahrenheit sıcaklık ölçekleri tam da böyle bir bağımlılıkla birbirine bağlıdır: °C = 5/9 (°F - 32), burada °C, Celsius ölçeğindeki sıcaklıktır (derece cinsinden) ve °F, yüzeydeki sıcaklıktır. Fahrenheit ölçeği.

Niceliksel ölçeklerden bilimde ve pratikte en yaygın olanı oran ölçekleridir. Doğal bir referans noktaları var - sıfır, yani. niceliğin yokluğu, ancak doğal ölçü biriminin olmaması. Çoğu fiziksel birim oran ölçeğinde ölçülür: vücut kütlesi, uzunluk, yük ve ekonomideki fiyatlar. Oran ölçeğinde kabul edilebilir dönüşümler benzerdir (yalnızca ölçeği değiştirir). Başka bir deyişle, serbest terimi olmayan doğrusal artan dönüşümler, örneğin fiyatların bir para biriminden diğerine sabit bir oranda dönüştürülmesi. İki yatırım projesinin ekonomik verimliliğini ruble cinsinden fiyatları kullanarak karşılaştırdığımızı varsayalım. İlk projenin ikincisinden daha iyi olmasına izin verin. Şimdi sabit bir dönüşüm oranı kullanarak Çin para birimine (yuan) geçelim. Açıkçası, ilk projenin ikincisinden daha karlı olması gerekiyor. Ancak hesaplama algoritmaları bu koşulun karşılandığını otomatik olarak garanti etmez ve karşılanıp karşılanmadığının kontrol edilmesi gerekir. Ortalama değerler için böyle bir testin sonuçları aşağıda açıklanmaktadır.

Fark ölçeğinin doğal bir ölçü birimi vardır ancak doğal bir referans noktası yoktur. Zaman, eğer yıl (veya gün - öğleden öğlene kadar) doğal bir ölçü birimi olarak alınırsa, farklılıklar ölçeğinde ve genel durumda aralıklar ölçeğinde ölçülür. Mevcut bilgi düzeyinde doğal bir başlangıç ​​noktası belirtmek imkansızdır. Farklı yazarlar, dünyanın yaratılış tarihini ve Mesih'in Doğuş anını farklı şekillerde hesaplarlar.

Yalnızca mutlak ölçek için ölçüm sonuçları, kelimenin genel anlamıyla sayılardır; örneğin bir odadaki kişi sayısı. Mutlak bir ölçek için yalnızca kimlik dönüşümüne izin verilir.

İlgili bilgi alanının geliştirilmesi sürecinde ölçek türü değişebilir. Böylece, ilk başta sıcaklık sıralı bir ölçekte (daha soğuk - daha sıcak) ölçüldü. Sonra - aralığa göre (Santigrat, Fahrenheit, Reaumur ölçekleri). Son olarak mutlak sıfırın keşfinden sonra sıcaklığın oran ölçeğinde (Kelvin ölçeği) ölçüldüğü düşünülebilir. Ölçülen belirli gerçek değerleri dikkate almak için hangi ölçeklerin kullanılması gerektiği konusunda uzmanlar arasında bazen anlaşmazlıkların olduğu unutulmamalıdır. Başka bir deyişle, ölçüm süreci aynı zamanda ölçek türünün (belirli bir ölçek türünün seçilmesinin gerekçesinin yanı sıra) belirlenmesini de içerir. Listelenen altı ana ölçek türüne ek olarak bazen başka ölçekler de kullanılır.

17. Değişmez algoritmalar ve ortalama değerler.

TI'daki veri analizi algoritmaları için temel gereksinimi formüle edelim: belirli bir tür ölçekte ölçülen verilere dayanarak çıkarılan sonuçlar, bu verilerin ölçüm ölçeğine izin verildiğinde değişmemelidir. Başka bir deyişle, çıkarımların geçerli ölçek dönüşümleri altında değişmez olması gerekir.

Dolayısıyla ölçüm teorisinin temel amaçlarından biri, gerçek nesnelere sayısal değerler atarken araştırmacının öznelliğiyle mücadele etmektir. Böylece mesafeler arshin, metre, mikron, mil, parsek ve diğer ölçü birimleri cinsinden ölçülebilir. Kütle (ağırlık) - pud, kilogram, pound vb. cinsinden. Mal ve hizmet fiyatları yuan, ruble, tenge, Grivnası, lat, kron, mark, ABD doları ve diğer para birimleri cinsinden belirtilebilir (belirtilen dönüşüm oranlarına tabidir). Oldukça açık olmasına rağmen çok önemli bir gerçeği vurgulayalım: Ölçü birimlerinin seçimi araştırmacıya bağlıdır. öznel. İstatistiksel sonuçlar, ancak araştırmacının tercih ettiği ölçüm birimine bağlı olmadıklarında ve ölçeğin izin verilen dönüşümüne göre değişmez olduklarında gerçekliğe uygun olabilir. Ekonometrik veri analizine yönelik birçok algoritmadan yalnızca birkaçı bu koşulu karşılar. Bunu ortalama değerleri karşılaştırarak gösterelim.

X 1, X 2,.., X n, n hacminin bir örneği olsun. Aritmetik ortalama sıklıkla kullanılır. Aritmetik ortalamanın kullanımı o kadar yaygındır ki, terimdeki ikinci kelime sıklıkla atlanır ve insanlar ortalama maaş, ortalama gelir ve belirli ekonomik veriler için diğer ortalamalardan bahseder; "ortalama" ile aritmetik ortalama kastedilir. Bu gelenek hatalı sonuçlara yol açabilir. Bunu, varsayımsal bir işletmenin çalışanlarının ortalama maaşını (ortalama gelirini) hesaplama örneğini kullanarak gösterelim. 100 işçiden yalnızca 5'inin maaşı bu rakamı aşıyor ve geri kalan 95'inin maaşı aritmetik ortalamanın çok altında. Bunun nedeni açıktır: Bir kişinin - genel müdürün - maaşı, düşük vasıflı ve yüksek vasıflı işçiler, mühendisler ve ofis çalışanları olan 95 işçinin maaşını aşıyor. Bu durum, 9'unun ateşi 40°C olan ve birinin zaten acı çeken 10 hastanın morgda 0° sıcaklıkta yattığı bir hastaneyle ilgili iyi bilinen bir hikayede anlatılanları anımsatıyor. C. Bu arada hastanedeki ortalama sıcaklık 36°C; daha iyi olamazdı!

Bu nedenle, aritmetik ortalama yalnızca oldukça homojen popülasyonlar için kullanılabilir (şu veya bu yönde büyük aykırı değerler olmadan). Ücretleri tanımlamak için hangi ortalamalar kullanılmalıdır? Maaşları azalmayacak şekilde sıralandığında 50. ve 51. çalışanların aritmetik ortalaması olan medyanı kullanmak oldukça doğaldır. İlk olarak 40 düşük vasıflı işçinin maaşları geliyor, ardından 41'inciden 70'inci işçiye kadar yüksek vasıflı işçilerin maaşları geliyor. Sonuç olarak, medyan özellikle onlara düşer ve 200'e eşittir. 50 işçi için maaş 200'ü geçmez ve 50 için - en az 200, bu nedenle medyan, çalışılan değerlerin büyük kısmının etrafında olduğu "merkez" i gösterir. gruplandırılmıştır. Diğer bir ortalama değer ise en sık tekrarlanan değer olan moddur. Söz konusu durumda, bunlar düşük vasıflı işçilerin ücretleridir; 100. Dolayısıyla maaşı tanımlamak için üç ortalama değerimiz var: mod (100 birim), medyan (200 birim) ve aritmetik ortalama (400 birim).

Gerçek hayatta gözlemlenen gelir ve ücret dağılımları için de aynı durum geçerlidir: Mod medyandan, medyan ise aritmetik ortalamadan küçüktür.

Ekonomide ortalamalar neden kullanılır? Ortalamaları kullanarak popülasyonları karşılaştırmak için genellikle bir sayı koleksiyonunu tek bir sayıyla değiştirmek. Örneğin, Y 1, Y 2,..., Y n, bir uzmanlık nesnesine (örneğin, bir şirketin stratejik gelişimi için seçeneklerden biri) "verilen" bir dizi uzman değerlendirmesi olsun, Z 1 , Z 2,..., Z n -ikincisi (bu gelişmenin başka bir versiyonu). Bu popülasyonlar nasıl karşılaştırılır? Açıkçası, en kolay yol ortalama değerlerdir.

Ortalamalar nasıl hesaplanır? Ortalamaların çeşitli türleri vardır: aritmetik ortalama, medyan, mod, geometrik ortalama, harmonik ortalama, ikinci dereceden ortalama. Ortalama değer genel kavramının 19. yüzyılın ilk yarısında bir Fransız matematikçi tarafından ortaya atıldığını hatırlayalım. Akademisyen O. Cauchy. Şöyledir: ortalama değer herhangi bir Ф(Х 1, Х 2,..., Х n) fonksiyonudur, öyle ki argümanların tüm olası değerleri için bu fonksiyonun değeri minimumdan az değildir. sayılar X 1, Х 2,... , X n ve bu sayıların maksimumundan fazla olamaz. Yukarıda listelenen tüm ortalama türleri Cauchy ortalamalarıdır.

Kabul edilebilir bir ölçek dönüşümüyle ortalamanın değeri açıkça değişir. Ancak ortalamanın hangi nüfus için daha fazla, hangi nüfus için daha az olduğuna ilişkin sonuçların değişmemesi gerekir (TI'de temel gereklilik olarak kabul edilen sonuçların değişmezliği şartına uygun olarak). Kabul edilebilir ölçek dönüşümlerine göre karşılaştırmanın sonucu kararlı olan ortalama değer tipinin aranmasına ilişkin ilgili matematik problemini formüle edelim.

Ф(Х 1 Х 2 ,..., Х n) Cauchy ortalaması olsun. İlk popülasyonun ortalamasının ikinci popülasyonun ortalamasından daha az olmasına izin verin: o zaman TI'ye göre, ortalamaların karşılaştırılması sonucunun istikrarı için, kabul edilebilir herhangi bir dönüşüm için g'nin kabul edilebilir dönüşümler grubundan olması gerekir. karşılık gelen ölçekte, birinci popülasyondan dönüştürülen değerlerin ortalamasının, ikinci küme için dönüştürülen değerlerin ortalamasından da daha az olduğu doğrudur. Ayrıca formüle edilen koşul herhangi iki Y 1, Y 2,...,Y n ve Z 1, Z 2,..., Z n kümesi ve hatırlayın, kabul edilebilir herhangi bir dönüşüm için doğru olmalıdır. Formüle edilen koşulu kabul edilebilir (uygun ölçekte) karşılayan ortalama değerlere diyoruz. TI'ye göre uzman görüşleri ve söz konusu ölçekte ölçülen diğer veriler analiz edilirken yalnızca bu tür ortalamalar kullanılabilir.

1970'lerde geliştirilen matematik teorisini kullanarak, kabul edilebilir ortalamaların türünü temel ölçeklerde tanımlamak mümkündür. İsim ölçeğinde ölçülen veriler için ortalama olarak yalnızca modun uygun olduğu açıktır.

18. Sıralı ölçekte ortalama değerler

Sıralı ölçekte ölçülen uzman görüşlerinin işlenmesini ele alalım. Aşağıdaki ifade doğrudur.

Teorem1 . Tüm Cauchy ortalamaları arasında yalnızca varyasyon serisinin üyeleri (sıralı istatistikler) sıralı ölçekte kabul edilebilir ortalamalardır.

Teorem 1, ortalama Ф(Х 1 Х 2 ,..., Х n)'nin sürekli (değişkenler kümesi üzerinde) ve simetrik bir fonksiyon olması koşuluyla geçerlidir. İkincisi, argümanlar yeniden düzenlendiğinde Ф(Х 1 Х 2 ,..., Х n) fonksiyonunun değerinin değişmediği anlamına gelir. Bu durum oldukça doğaldır, çünkü dizi için değil, bütünlük (küme) için ortalama değeri buluyoruz. Küme, elemanlarını listelediğimiz sıraya göre değişmez.

Özellikle Teorem 1'e göre medyan, sıralı bir ölçekte ölçülen veriler için ortalama olarak kullanılabilir (örnek boyutu tek ise). Hacim eşitse, varyasyon serisinin iki merkezi teriminden biri kullanılmalıdır; bazen sol medyan veya sağ medyan olarak da adlandırılırlar. Moda da kullanılabilir; her zaman varyasyon serisinin bir üyesidir. Ancak aritmetik ortalamayı, geometrik ortalamayı vb. asla hesaplayamazsınız.

Aşağıdaki teorem doğrudur.

Teorem 2. Y 1, Y 2,...,Y m, F(x) dağılım fonksiyonuna sahip bağımsız özdeş dağıtılmış rastgele değişkenler olsun ve Z 1, Z 2,..., Zn, fonksiyon dağılımlarına sahip bağımsız özdeş dağıtılmış rastgele değişkenler olsun H(x) ve Y 1, Y 2,...,Y m ve Z 1, Z 2,..., Z n örnekleri birbirinden bağımsızdır ve MY X > MZ X'tir. |g i |>X koşulunu sağlayan herhangi bir kesin artan sürekli g fonksiyonu için min(m, n)'de bir olayın olasılığının 1'e yönelmesi için, F(x) eşitsizliğinin herkes için karşılanması gerekli ve yeterlidir. X< Н(х), причем существовало число х 0 , для которого F(x 0)

Not.Üst limite sahip durum doğası gereği tamamen matematik içidir. Aslında g fonksiyonu sıralı ölçekte keyfi olarak kabul edilebilir bir dönüşümdür.

Teorem 2'ye göre, teoremde verilen eşitsizliği sağlayan iki dağılımdan alınan örnekler karşılaştırıldığında sıralı ölçekte aritmetik ortalama da kullanılabilir. Basitçe söylemek gerekirse, dağıtım işlevlerinden biri her zaman diğerinin üzerinde yer almalıdır. Dağıtım fonksiyonları kesişemez, sadece birbirlerine temas etmelerine izin verilir. Bu koşul, örneğin dağıtım fonksiyonlarının yalnızca vardiyada farklılık göstermesi durumunda karşılanır:

F(x) = Н(x + ∆)

bazıları için ∆.

Son koşul, belirli bir miktarın iki değeri aynı ölçüm cihazı kullanılarak ölçülürse yerine getirilir; burada söz konusu miktarın bir değerinin ölçülmesinden diğerinin ölçülmesine geçerken hata dağılımı değişmez.

Kolmogorov'a göre ortalama

Yukarıda listelenen ortalamaların birçoğunun genelleştirilmesi Kolmogorov ortalamasıdır. X 1, X 2,..., X n sayıları için Kolmogorov ortalaması aşağıdaki formül kullanılarak hesaplanır

G((F(X l) + F(X 2)+...F(X n))/n),

burada F kesinlikle monotonik bir fonksiyondur (yani kesinlikle artan veya kesinlikle azalan),

G, F'nin ters fonksiyonudur.

Kolmogorov'un ortalamaları arasında pek çok tanınmış karakter var. Yani, eğer F(x) = x ise, Kolmogorov ortalaması aritmetik ortalamadır, eğer F(x) = lnx ise, o zaman geometrik ortalama, eğer F(x) = 1/x ise, o zaman harmonik ortalama, eğer F( x) = x 2, ardından ortalama kare vb. Kolmogorov ortalaması Cauchy ortalamasının özel bir durumudur. Öte yandan medyan ve mod gibi popüler ortalamalar Kolmogorov ortalamaları olarak temsil edilemez. Aşağıdaki ifadeler monografide kanıtlanmıştır.

Teorem3 . Aralık ölçeğinde belirli matematik içi düzenlilik koşulları geçerliyse, Kolmogorov'un araçları arasında yalnızca aritmetik ortalama kabul edilebilir. Bu nedenle, sıcaklıkların (Santigrat cinsinden) veya mesafelerin geometrik ortalaması veya kök ortalama karesi anlamsızdır. Ortalama olarak aritmetik ortalama kullanılmalıdır. Medyanı veya modu da kullanabilirsiniz.

Teorem 4. Oranlar ölçeğindeki belirli matematik içi düzenlilik koşulları geçerliyse, tüm Kolmogorov ortalamaları arasında yalnızca F(x) = x c olan güç ortalamaları ve geometrik ortalama kabul edilebilir.

Yorum. Geometrik ortalama, c > 0 için güç ortalamalarının sınırıdır.

Oran ölçeğinde kullanılamayan Kolmogorov ortalamaları var mı? Elbette var. Örneğin F(x) = e x.

Ortalama değerlere benzer şekilde, diğer istatistiksel özellikler de incelenebilir - dağılım, bağlantı, mesafe vb. göstergeleri. Örneğin, bir aralıklar kasesinde korelasyon katsayısının kabul edilebilir herhangi bir dönüşümle değişmediğini, tıpkı dağılımların oranı gibi, dağılımın farklar ölçeğinde değişmediğini, değişim katsayısının da farklılık ölçeğinde değişmediğini göstermek zor değildir. oranların ölçeği vb.

Yukarıdaki ortalama değerlere ilişkin sonuçlar, yalnızca ekonomide, yönetimde, uzman değerlendirme teorisinde veya sosyolojide değil, aynı zamanda mühendislikte, örneğin yüksek fırınların otomatik proses kontrol sistemlerinde sensörlerin toplanmasına yönelik yöntemleri analiz etmek için yaygın olarak kullanılmaktadır. TI, standardizasyon ve kalite yönetimi problemlerinde, özellikle ilginç teorik sonuçların elde edildiği kalite alanında büyük pratik öneme sahiptir. Dolayısıyla, örneğin, ürün kalitesine ilişkin bireysel göstergelerin ağırlık katsayılarındaki herhangi bir değişiklik, ürünlerin ağırlıklı ortalama göstergesine göre sıralanmasında bir değişikliğe yol açar (bu teorem Prof. V.V. Podinovsky tarafından kanıtlanmıştır). Sonuç olarak, TI ve yöntemleri hakkında yukarıdaki kısa bilgiler bir anlamda ekonomi, sosyoloji ve mühendislik bilimlerini birleştirir ve daha önce etkili analize uygun olmayan karmaşık sorunları çözmek için yeterli bir aygıttır. Gerçekçi modeller oluşturmanın ve tahmin problemini çözmenin yolu açılır.

22. Eşleştirilmiş doğrusal regresyon

Şimdi ikili doğrusal regresyonun en basit durumuna ilişkin daha ayrıntılı bir çalışmaya geçelim. Doğrusal regresyon, düz çizgi denklemi biçimindeki en basit fonksiyonel ilişkiyle tanımlanır ve model parametrelerinin (denklem katsayıları) şeffaf bir şekilde yorumlanmasıyla karakterize edilir. Denklemin sağ tarafı, regresörün (açıklayıcı değişken) verilen değerlerine dayanarak ortaya çıkan (açıklanan) değişkenin teorik (hesaplanan) değerlerini elde etmemizi sağlar. Bu değerlere bazen tahmin edilenler de denir (aynı anlamda), yani. teorik formüllerden elde edilir. Ancak bağımlılığın doğası hakkında bir hipotez öne sürüldüğünde denklemin katsayıları hala bilinmemektedir. Genel olarak bakıldığında bu katsayıların yaklaşık değerlerinin elde edilmesi çeşitli yöntemler kullanılarak mümkündür.

Ancak bunlardan en önemlisi ve yaygın olanı en küçük kareler yöntemidir (OLS). Ortaya çıkan özelliğin gerçek değerlerinin hesaplanan (teorik) değerlerden karesel sapmalarının toplamının en aza indirilmesi gerekliliğine (daha önce açıklandığı gibi) dayanmaktadır. Teorik değerler yerine (bunları elde etmek için), regresyon denkleminin sağ taraflarını kare sapmaların toplamına değiştirin ve ardından bu fonksiyonun kısmi türevlerini bulun (gerçek değerlerin kare sapmalarının toplamı) teorik olanlardan elde edilen karakteristiklerin). Bu kısmi türevler x ve y değişkenlerine göre değil, a ve b parametrelerine göre alınır. Kısmi türevler sıfıra eşitlenir ve basit ama zahmetli dönüşümlerden sonra parametrelerin belirlenmesi için bir normal denklem sistemi elde edilir. X değişkeninin katsayısı, yani. b'ye regresyon katsayısı denir, faktördeki bir birimlik değişiklikle sonuçtaki ortalama değişimi gösterir. Özellikle bu katsayının işareti negatifse, a parametresinin ekonomik bir yorumu olmayabilir.

Tüketim fonksiyonunu incelemek için ikili doğrusal regresyon kullanılır. Çarpanı hesaplamak için tüketim fonksiyonundaki regresyon katsayısı kullanılır. Hemen hemen her zaman regresyon denklemi, bağlantının yakınlığının bir göstergesi ile desteklenir. En basit doğrusal regresyon durumu için, bağlantının yakınlığının bu göstergesi doğrusal korelasyon katsayısıdır. Ancak doğrusal korelasyon katsayısı, özellikler arasındaki bağlantının yakınlığını doğrusal bir biçimde karakterize ettiğinden, doğrusal korelasyon katsayısının mutlak değerinin sıfıra yakınlığı, henüz özellikler arasında bir bağlantının olmadığının bir göstergesi olarak hizmet etmez.

Farklı bir model spesifikasyonu seçimi ve dolayısıyla bağımlılık türü ile gerçek ilişkinin birliğe oldukça yakın olduğu ortaya çıkabilir. Ancak doğrusal bir fonksiyonun seçiminin kalitesi, doğrusal korelasyon katsayısının karesi - belirleme katsayısı kullanılarak belirlenir. Etkili özelliğin toplam varyansındaki regresyonla açıklanan etkili özelliğin y varyansının oranını karakterize eder. Belirleme katsayısını 1'e tamamlayan değer, modelde dikkate alınmayan diğer faktörlerin etkisinden kaynaklanan varyansın payını (artık varyans) karakterize eder.

Eşleştirilmiş regresyon, aşağıdaki formdaki iki değişken y ve x'i ilişkilendiren bir denklemle temsil edilir:

burada y bağımlı değişkendir (sonuç niteliği) ve x bağımsız değişkendir (açıklayıcı değişken veya nitelik faktörü). Doğrusal regresyon ve doğrusal olmayan regresyon vardır. Doğrusal regresyon aşağıdaki formdaki bir denklemle tanımlanır:

y = a+ bx + .

Doğrusal olmayan regresyon ise analize dahil edilen açıklayıcı değişkenlere göre doğrusal olmayabilir, ancak tahmin edilen parametrelere göre doğrusal olabilir. Veya belki de regresyon, tahmin edilen parametreler açısından doğrusal değildir. Açıklayıcı değişkenlerde doğrusal olmayan, ancak tahmin edilen parametrelerde doğrusal olan regresyon örnekleri arasında çeşitli derecelerdeki polinom bağımlılıkları (polinomlar) ve bir eşkenar hiperbol yer alır.

Tahmin edilen parametreler için doğrusal olmayan regresyon, parametreye göre bir güç bağımlılığıdır (parametre üssün içindedir), parametrenin üssün tabanında olduğu üstel bir bağımlılık ve tüm doğrusal bağımlılığın tamamen olduğu üstel bir bağımlılıktır. üssünde. Bu üç durumun hepsinde, rastgele bileşenin (rastgele kalan)  denklemin sağ tarafında bir toplam olarak değil bir faktör olarak dahil edildiğine dikkat edin; çarpımsal olarak! Ortaya çıkan özelliğin hesaplanan değerlerinin gerçek olanlardan ortalama sapması, ortalama yaklaşım hatası ile karakterize edilir. Yüzde olarak ifade edilir ve %7-8’i geçmemelidir. Bu ortalama yaklaşım hatası, gerçek ve hesaplanan değerler arasındaki farkların göreceli büyüklüklerinin yüzde ortalamasıdır.

Birçok ekonomik olay ve sürecin önemli bir özelliği olan ortalama esneklik katsayısı önemlidir. Belirli bir fonksiyonel ilişkinin türevinin değeri ile x'in ortalama değerinin y'nin ortalama değerine oranının çarpımı olarak hesaplanır. Esneklik katsayısı, x faktörünün (x faktörü) ortalama değerinden %1 oranında değişmesi durumunda y sonucunun ortalama değerinden yüzde kaç oranında değişeceğini gösterir.

Varyans analizi sorunları ikili regresyon, çoklu regresyon (birçok faktör olduğunda) ve artık varyans ile yakından ilişkilidir. Varyans analizi bağımlı değişkenin varyansını inceler. Bu durumda sapmaların karelerinin toplamı iki kısma bölünür. İlk terim, regresyondan kaynaklanan veya açıklanan (faktöriyel) sapmaların karelerinin toplamıdır. İkinci terim, faktör regresyonuyla açıklanamayan karesel sapmaların artık toplamıdır.

Ortaya çıkan y karakteristiğinin toplam varyansında regresyonla açıklanan varyans payı, regresyondan kaynaklanan karesel sapmaların toplamının toplam sapmaların karesi toplamına oranından başka bir şey olmayan belirleme katsayısı (indeksi) ile karakterize edilir. (tüm toplamın ilk terimi).

Model parametreleri (bilinmeyenlerin katsayıları) en küçük kareler yöntemi kullanılarak belirlendiğinde, özünde bazı rastgele değişkenler bulunur (tahminlerin elde edilmesi sürecinde). Rasgele değişkenin özel bir formu olan regresyon katsayısının tahmini özellikle önemlidir. Bu rastgele değişkenin özellikleri denklemdeki (modeldeki) artık terimin özelliklerine bağlıdır. Eşleştirilmiş doğrusal regresyon modeli için, açıklayıcı değişken x'i rastgele olmayan bir dışsal değişken olarak düşünün. Bu sadece, tüm gözlemlerdeki x değişkeninin değerlerinin önceden belirlenmiş olarak kabul edilebileceği ve hiçbir şekilde incelenen bağımlılıkla ilgili olamayacağı anlamına gelir. Dolayısıyla, açıklanan değişkenin gerçek değeri iki bileşenden oluşur: rastgele olmayan ve rastgele bir bileşen (artık terim).

En küçük kareler yöntemi (OLS) kullanılarak belirlenen regresyon katsayısı ise x ve y değişkenlerinin kovaryansının x değişkeninin varyansına bölünmesi oranına eşittir. Bu nedenle aynı zamanda rastgele bir bileşen de içerir. Sonuçta, kovaryans, y değişkeninin değerlerine bağlıdır; burada y değişkeninin değerleri, rastgele artık terimin  değerlerine bağlıdır. Ayrıca, x ve y değişkenlerinin kovaryansının, tahmin edilen regresyon katsayısı beta () ile x değişkeninin varyansının artı x ve  değişkenlerinin kovaryansının çarpımına eşit olduğunu göstermek kolaydır. Dolayısıyla, beta regresyon katsayısının tahmini, x ve  değişkenlerinin kovaryansının x değişkeninin varyansına bölünmesiyle elde edilen bölüme eklenen bu bilinmeyen regresyon katsayısının kendisine eşittir. Onlar. herhangi bir örnekten elde edilen regresyon katsayısı b'nin tahmini, iki terimin toplamı olarak sunulur:  (beta) katsayısının gerçek değerine eşit bir sabit değer ve x ve  değişkenlerinin kovaryansına bağlı rastgele bir bileşen. .

23. Matematiksel Gauss-Markov koşulları ve uygulamaları.

Sıradan OLS'ye dayalı regresyon analizinin en iyi sonuçları üretmesi için, rastgele terimin dört Gauss-Markov koşulunu karşılaması gerekir.

Rastgele terimin matematiksel beklentisi sıfıra eşittir, yani. tarafsızdır. Regresyon denklemi sabit bir terim içeriyorsa, bu gereksinimin karşılandığını düşünmek doğaldır, çünkü bu sabit bir terimdir ve y değişkeninin değerlerindeki herhangi bir sistematik eğilimi hesaba katmalıdır; , regresyon denkleminin açıklayıcı değişkenlerinde yer almamalıdır.

Rastgele terimin varyansı tüm gözlemler için sabittir.

Örneği oluşturan rastgele değişkenlerin değerlerinin kovaryansı sıfıra eşit olmalıdır, yani. herhangi iki gözlemdeki rastgele terimin değerleri arasında sistematik bir ilişki yoktur. Rastgele üyelerin birbirinden bağımsız olması gerekir.

Rastgele terimin dağılım yasası açıklayıcı değişkenlerden bağımsız olmalıdır.

Üstelik birçok uygulamada açıklayıcı değişkenler stokastik değildir; rastgele bir bileşeni yoktur. Her bir gözlemdeki herhangi bir bağımsız değişkenin değeri, regresyon denkleminde dikkate alınmayan tamamen dış nedenlerle belirlenen dışsal olarak kabul edilmelidir.

Belirtilen Gauss-Markov koşullarıyla birlikte rastgele terimin normal dağılıma sahip olduğu da varsayılmaktadır. Çok geniş koşullar altında geçerlidir ve merkezi limit teoremine (CLT) dayanmaktadır. Bu teoremin özü şudur: Eğer bir rastgele değişken, çok sayıda başka rastgele değişkenin etkileşiminin genel sonucuysa ve bunların hiçbiri bu genel sonucun davranışı üzerinde baskın bir etkiye sahip değilse, o zaman ortaya çıkan rastgele değişken tanımlanacaktır. yaklaşık olarak normal bir dağılıma sahiptir. Normal dağılıma olan bu yakınlık, normal dağılım ve bir anlamda onun genellemesi olan Öğrenci dağılımının kullanılmasını, esas olarak "kuyruk" olarak adlandırılan, normal dağılımdan belirgin şekilde farklı olan tahminler elde etmeyi mümkün kılar. ” yani küçük numune boyutları için. Rastgele terimin normal dağılması durumunda regresyon katsayılarının da normal dağılması önemlidir.

Oluşturulan regresyon eğrisi (regresyon denklemi), nokta tahmini olarak adlandırılan problemi çözmemize olanak sağlar. Bu tür hesaplamalarda, çalışılan gözlem aralığının dışında belirli bir x değeri alınır ve regresyon denkleminin sağ tarafına yerleştirilir (ekstrapolasyon prosedürü). Çünkü Regresyon katsayılarına ilişkin tahminler zaten biliniyorsa, o zaman alınan x değerine karşılık gelen açıklanan değişken y'nin değerini hesaplamak mümkündür. Doğal olarak tahminin (tahmin) anlamına uygun olarak hesaplamalar ileriye doğru (gelecekteki değerler alanına) yapılır.

Ancak katsayılar belirli bir hatayla belirlendiğinden, önemli olan sonuç niteliğine ilişkin nokta tahmini (nokta tahmini) değil, belirli bir olasılıkla değerlerin hangi sınırlar içinde olduğu bilgisidir. x faktörünün alınan değerine karşılık gelen sonuç niteliği yalan olacaktır.

Bunu yapmak için standart hata (standart sapma) hesaplanır. Az önce söylenenlerin ruhuyla şu şekilde elde edilebilir. Tahminlerden ortalama değerlere kadar olan serbest a teriminin ifadesi, doğrusal regresyon denkleminde ikame edilir. Daha sonra standart hatanın ortalama etkili faktör y'nin hatasına ve ek olarak regresyon katsayısı b'nin hatasına bağlı olduğu ortaya çıkar. Basitçe, bu standart hatanın karesi, ortalama y değerinin kare hatasının toplamı ile regresyon katsayısının kare hatasının x faktörünün ve ortalamasının kare sapması ile çarpımına eşittir. Ayrıca, istatistik yasalarına göre ilk terim, genel popülasyonun varyansının numunenin büyüklüğüne (hacmine) bölünmesi oranına eşittir.

Bilinmeyen varyans yerine, örneklem varyansı tahmin olarak kullanılır. Buna göre regresyon katsayısının hatası, örneklem varyansının x faktörünün varyansına bölünmesinin oranı olarak tanımlanır. Standart hatayı (standart sapma) ve doğrusal regresyon modelinden daha bağımsız olan diğer hususları elde edebilirsiniz. Bunun için ortalama hata ve marjinal hata kavramları ve aralarındaki ilişki kullanılır.

Ancak standart hatanın elde edilmesinden sonra bile tahmin edilen değerin hangi sınırlar içinde olacağı sorusu hala ortadadır. Başka bir deyişle, ölçüm hatası aralığı hakkında, birçok durumda bu aralığın ortasının etkin faktör y'nin hesaplanan (ortalama) değeri tarafından verildiği şeklindeki doğal varsayımda. Burada, bilinmeyen miktarın hangi olasılıkla bu güven aralığı içinde olduğunu tam olarak gösteren merkezi limit teoremi kurtarmaya gelir.

Temel olarak standart hata formülü, nasıl ve hangi biçimde elde edildiğine bakılmaksızın, regresyon çizgisinin konumundaki hatayı karakterize eder. Standart hata, x faktörünün değeri faktörün ortalama değeriyle çakıştığında minimuma ulaşır.

24. Hipotezlerin istatistiksel olarak test edilmesi ve Fisher kriteri kullanılarak doğrusal regresyonun öneminin değerlendirilmesi.

Doğrusal regresyon denklemi bulunduktan sonra hem denklemin bir bütün olarak hem de bireysel parametrelerinin önemi değerlendirilir. Bir regresyon denkleminin öneminin bir bütün olarak değerlendirilmesi çeşitli kriterler kullanılarak yapılabilir. Oldukça yaygın ve etkili olan Fisher's F testinin kullanılmasıdır. Bu durumda regresyon katsayısının sıfıra eşit olduğu yönünde sıfır hipotezi ileri sürülmektedir; b=0 olduğundan x faktörünün y sonucu üzerinde hiçbir etkisi yoktur. F testinin anında hesaplanmasından önce varyans analizi yapılır. Buradaki merkezi yer, y değişkeninin ortalama y değerinden sapmalarının kare toplamının iki parçaya - “açıklanmış” ve “açıklanmamış” olarak ayrıştırılmasıyla işgal edilmiştir:

Ortaya çıkan karakteristik y'nin bireysel değerlerinin ortalama y değerinden kare sapmalarının toplam toplamı birçok faktörün etkisinden kaynaklanır.

Tüm nedenler kümesini koşullu olarak iki gruba ayıralım: çalışılan faktör x ve diğer faktörler. Faktör sonucu etkilemiyorsa grafikteki regresyon çizgisi OX ve y=y eksenine paraleldir. Bu durumda, ortaya çıkan özelliğin tüm varyansı, diğer faktörlerin etkisinden kaynaklanmaktadır ve sapmaların toplam karesi toplamı, artık ile çakışacaktır. Eğer diğer faktörler sonucu etkilemiyorsa, o zaman y fonksiyonel olarak x ile ilişkilidir ve kalan kareler toplamı sıfırdır. Bu durumda regresyonun açıkladığı sapmaların kareleri toplamı, toplam kareler toplamına eşittir. Korelasyon alanının tüm noktaları regresyon çizgisi üzerinde bulunmadığından, bunların saçılımı her zaman x faktörünün etkisiyle meydana gelir; y'nin x üzerinde gerilemesi ve diğer nedenlerden kaynaklanması (açıklanamayan varyasyon). Bir regresyon çizgisinin tahmin için uygunluğu, y özelliğindeki toplam varyasyonun ne kadarının açıklanan varyasyon tarafından açıklandığına bağlıdır.

Açıkçası, eğer regresyondan kaynaklanan sapmaların kareleri toplamı kalan kareler toplamından büyükse, bu durumda regresyon denklemi istatistiksel olarak anlamlıdır ve x faktörünün sonuç üzerinde önemli bir etkisi vardır. Bu, belirleme katsayısının birliğe yaklaşacağı gerçeğine eşdeğerdir. Herhangi bir karesel sapma toplamı serbestlik derecesi sayısıyla ilgilidir; Bir özelliğin bağımsız değişim özgürlüğünün sayısı. Serbestlik derecesinin sayısı, popülasyonun birim sayısıyla veya ondan belirlenen sabitlerin sayısıyla ilişkilidir. İncelenmekte olan problemle ilgili olarak, serbestlik derecesi sayısı, n olası [(y 1 -y), (y 2 -y),...(y n -y)] üzerinden kaç tane bağımsız sapmanın gerekli olduğunu göstermelidir. Belirli bir kareler toplamını oluşturmak için. Bu nedenle, ∑(y-y sr) 2 karelerinin toplamı için (n-1) bağımsız sapmalar gereklidir, çünkü n birimlik bir popülasyonda, ortalama seviye hesaplandıktan sonra yalnızca (n-1) sapma sayısı serbestçe değişir. ∑(y-y ort) 2 karelerinin açıklanan veya faktör toplamını hesaplarken, regresyon çizgisi boyunca bulunan y* bileşke karakteristiğinin teorik (hesaplanan) değerleri kullanılır: y(x)=a+bx.

Şimdi etkin faktörün bu değerin ortalamasından sapmalarının karelerinin toplamının açılımına dönelim. Bu toplam, yukarıda tanımlanan iki parçayı içerir: regresyonla açıklanan sapmaların karelerinin toplamı ve sapmaların karelerinin kalan toplamı adı verilen başka bir toplam. Bu ayrıştırmayla bağlantılı olan varyans analizi temel soruyu doğrudan yanıtlar: Bir bütün olarak regresyon denkleminin ve bireysel parametrelerinin önemi nasıl değerlendirilir? Aynı zamanda bu sorunun anlamını da büyük ölçüde belirler. Regresyon denkleminin önemini bir bütün olarak değerlendirmek için Fisher kriteri (F testi) kullanılır. Fisher tarafından önerilen yaklaşıma göre, bir sıfır hipotezi ileri sürülmektedir: regresyon katsayısı sıfıra eşittir, yani. değerb=0. Bu, X faktörünün Y sonucu üzerinde hiçbir etkisinin olmadığı anlamına gelir.

İstatistiksel bir çalışma sonucunda elde edilen puanların neredeyse her zaman regresyon doğrusu üzerinde tam olarak yer almadığını unutmayalım. Regresyon çizgisinden aşağı yukarı uzakta oldukları için dağınıktırlar. Bu tür bir dağılım, regresyon denkleminde dikkate alınmayan açıklayıcı X faktöründen farklı diğer faktörlerin etkisinden kaynaklanmaktadır. Açıklanan veya kare sapmaların faktör toplamı hesaplanırken, regresyon çizgisinden bulunan sonuçta ortaya çıkan özelliğin teorik değerleri kullanılır.

Y ve X değişkenlerinin belirli bir değer kümesi için, ortalama Y değerinin hesaplanan değeri, doğrusal regresyonda yalnızca bir parametrenin - regresyon katsayısının - bir fonksiyonudur. Buna göre sapmaların kareleri toplamı 1'e eşit serbestlik derecesine sahiptir. Lineer regresyonda sapmaların kareleri toplamının serbestlik derecesi sayısı ise n-2'dir.

Sonuç olarak, orijinal genişlemedeki sapmaların her karesi toplamını serbestlik derecesi sayısına bölerek, ortalama sapmaların karesini (bir serbestlik derecesi başına varyans) elde ederiz. Daha sonra, faktör varyansını bir serbestlik derecesine göre kalan varyansa bölerek, sıfır hipotezini test etmek için F oranı olarak adlandırılan bir kriter veya aynı adı taşıyan kriter elde ederiz. Yani sıfır hipotezi doğruysa faktör ve artık varyanslar basitçe birbirine eşittir.

Sıfır hipotezini reddetmek için, yani. incelenmekte olan ilişkinin öneminin (varlığının) gerçeğini ifade eden ve aslında var olmayan bir ilişkiyi simüle eden faktörlerin rastgele bir tesadüfünü değil, karşıt hipotezi kabul etmek, kritik değer tablolarının kullanılması gerekir. belirtilen ilişki. Tablolar kullanılarak Fisher kriterinin kritik (eşik) değeri belirlenir. Aynı zamanda teorik olarak da adlandırılır. Daha sonra bunu, gözlemsel verilerden hesaplanan kriterin karşılık gelen ampirik (gerçek) değeriyle karşılaştırarak oranın gerçek değerinin tablolardaki kritik değeri aşıp aşmadığını kontrol ederler.

Bu daha detaylı olarak şu şekilde yapılır. Sıfır hipotezinin varlığına ilişkin belirli bir olasılık düzeyi seçin ve tablolardan, 1 serbestlik derecesine kadar rastgele bir varyans farklılığının hala meydana gelebileceği F kriterinin kritik değerini bulun; bu tür maksimum değer. Daha sonra F oranının hesaplanan değeri, bu oranın tablodakinden büyük olması durumunda güvenilir kabul edilir (yani gerçek ve artık varyanslar arasındaki farkı ifade eder). Daha sonra sıfır hipotezi reddedilir (hiçbir bağlantı belirtisinin olmadığı doğru değildir) ve tam tersine bağlantının var olduğu ve anlamlı olduğu (rastgele olmadığı, anlamlı olduğu) sonucuna varırız.

İlişkinin değeri tablodakinden daha düşük çıkarsa, sıfır hipotezinin olasılığı belirtilen seviyeden (başlangıçta seçilmiş olan) daha yüksek olur ve sıfır hipotezi gözle görülür bir tehlike olmaksızın reddedilemez. bir ilişkinin varlığı hakkında yanlış bir sonuca varmak. Buna göre regresyon denklemi önemsiz kabul edilir.

F kriterinin değeri, belirleme katsayısı ile ilgilidir. Regresyon denkleminin öneminin bir bütün olarak değerlendirilmesine ek olarak, regresyon denkleminin bireysel parametrelerinin önemi de değerlendirilir. Bu durumda, regresyon katsayısının standart hatası ampirik gerçek standart sapma ve serbestlik derecesi başına ampirik varyans kullanılarak belirlenir. Öğrenci dağılımı daha sonra güven aralıklarını hesaplamak amacıyla regresyon katsayısının önemini test etmek için kullanılır.

Regresyon ve korelasyon katsayılarının öneminin Öğrenci t-testi kullanılarak değerlendirilmesi, bu büyüklüklerin değerleri ile standart hata karşılaştırılarak gerçekleştirilir. Doğrusal regresyon parametrelerinin ve korelasyon katsayısının hatasının büyüklüğü aşağıdaki formüllerle belirlenir:

burada S, ortalamanın karekökü artık örnek sapmasıdır,

r xy – korelasyon katsayısı.

Buna göre regresyon doğrusu tarafından tahmin edilen standart hatanın değeri aşağıdaki formülle verilmektedir:

Regresyon ve korelasyon katsayılarının değerlerinin standart hatalarına karşılık gelen oranları, t-istatistiklerini oluşturur ve karşılık gelen tablolanmış (kritik) değer ile gerçek değerinin karşılaştırılması, birinin boş değeri kabul etmesine veya reddetmesine olanak tanır. hipotez. Ancak daha sonra, güven aralığını hesaplamak için, her göstergeye ilişkin maksimum hata, t istatistiğinin tablolaştırılmış değerinin karşılık gelen göstergenin ortalama rastgele hatasıyla çarpımı olarak bulunur. Aslında biraz yukarıda biraz farklı yazmıştık. Daha sonra güven aralıklarının sınırları elde edilir: alt sınır, karşılık gelen marjinal hatanın karşılık gelen katsayılardan (aslında ortalama) çıkarılmasıyla elde edilir ve üst sınır ise toplama (toplama) yoluyla yapılır.

Doğrusal regresyonda ∑(y x -y ort) 2 =b 2 ∑(x-x ort) 2. Doğrusal korelasyon katsayısı formülüne başvurarak bunu doğrulamak kolaydır: r 2 xy = b 2 *σ 2 x /σ 2 y

burada σ 2 y, y özelliğinin toplam varyansıdır;

σ 2 x - x faktörüne bağlı olarak y karakteristiğinin dağılımı. Buna göre doğrusal regresyondan kaynaklanan sapmaların karelerinin toplamı şöyle olacaktır:

∑(y x -y ort) 2 =b 2 ∑(x-x ort) 2 .

x ve y'deki belirli bir gözlem hacmi için, doğrusal regresyondaki karelerin faktör toplamı, regresyon katsayısı b'nin yalnızca bir sabitine bağlı olduğundan, bu kareler toplamı bir serbestlik derecesine sahiptir. Y özelliğinin hesaplanan değerinin içerik tarafını ele alalım; yx. Y x değeri doğrusal regresyon denklemi ile belirlenir: y x ​​= a + bx.

a parametresi a=y-bx olarak tanımlanabilir. A parametresinin ifadesini doğrusal modelde değiştirerek şunu elde ederiz: y x ​​=y-bx+bx ort =y-b(x-x ort).

Belirli bir y ve x değişkenleri kümesi için, doğrusal regresyonda y x'in hesaplanan değeri yalnızca bir parametrenin, yani regresyon katsayısının bir fonksiyonudur. Buna göre sapmaların karelerinin faktör toplamı 1'e eşit bir serbestlik derecesine sahiptir.

Toplam, faktör ve kalan kareler toplamlarının serbestlik derecesi sayısı arasında eşitlik vardır. Doğrusal regresyonda artık kareler toplamının serbestlik derecesi sayısı (n-2)'dir. Toplam kareler toplamı için serbestlik derecesi sayısı birlerin sayısına göre belirlenir ve örnek verilerden hesaplanan ortalamayı kullandığımız için bir serbestlik derecesini kaybederiz, yani. (n-1). Yani iki eşitliğimiz var: toplamlar için ve serbestlik derecesi sayısı için. Bu da bizi, oranı Fisher kriterini veren, serbestlik derecesi başına karşılaştırılabilir varyanslara geri getiriyor.

25. Regresyon denkleminin bireysel parametrelerinin ve katsayılarının öneminin Öğrenci testini kullanarak değerlendirilmesi.

27. Doğrusal ve doğrusal olmayan regresyon ve araştırma yöntemleri.

Bu çok önemli ama yine de en basit duruma ek olarak, onların yardımıyla daha karmaşık doğrusal olmayan bağımlılıkları analiz etmek için bir araç elde etmemiş olsaydık, doğrusal regresyon ve araştırma ve değerlendirme yöntemleri o kadar önemli olmazdı. Doğrusal olmayan regresyonlar önemli ölçüde farklı iki sınıfa ayrılabilir. Bunlardan ilki ve daha basiti, açıklayıcı değişkenlere göre doğrusal olmayan ancak içlerinde yer alan ve değerlendirmeye tabi olan parametrelerde doğrusal kalan doğrusal olmayan bağımlılıklar sınıfıdır. Buna çeşitli derecelerdeki polinomlar ve eşkenar hiperbol dahildir.

Açıklamada yer alan değişkenler için, değişkenlerin basitçe dönüştürülmesi (değiştirilmesi) yoluyla yapılan bu tür doğrusal olmayan regresyon, yeni değişkenler için kolaylıkla sıradan doğrusal regresyona indirgenebilir. Bu nedenle, bu durumda parametrelerin tahmini, parametrelerdeki bağımlılıklar doğrusal olduğundan, basitçe en küçük kareler ile gerçekleştirilir. Dolayısıyla, eşkenar hiperbol ile tanımlanan doğrusal olmayan bağımlılık ekonomide önemli bir rol oynar:

Parametreleri en küçük kareler yöntemi kullanılarak iyi bir şekilde değerlendirilir ve bu bağımlılığın kendisi, hammadde, yakıt, malzemelerin belirli maliyetleri ile çıktı hacmi, malların dolaşım süresi ve tüm bu faktörler ile ticaret miktarı arasındaki bağlantıyı karakterize eder. ciro. Örneğin Phillips eğrisi işsizlik oranı ile ücret artış yüzdesi arasındaki doğrusal olmayan ilişkiyi karakterize eder.

Tahmin edilen parametrelerde doğrusal olmayan, örneğin derecenin kendisinin (üstelinin) bir parametre olduğu veya parametreye bağlı olduğu bir güç fonksiyonu ile temsil edilen regresyonda durum tamamen farklıdır. Derecenin tabanının bir parametre olduğu üstel bir fonksiyon ve yine göstergenin bir parametre veya parametrelerin bir kombinasyonunu içerdiği bir üstel fonksiyon da olabilir. Bu sınıf da iki alt sınıfa bölünmüştür: biri harici olarak doğrusal olmayan, ancak esas olarak dahili olarak doğrusal olanı içerir. Bu durumda dönüşümleri kullanarak modeli doğrusal bir forma getirebilirsiniz. Ancak model içsel olarak doğrusal değilse, doğrusal bir fonksiyona indirgenemez.

Bu nedenle, yalnızca regresyon analizinde doğası gereği doğrusal olmayan modellerin gerçek anlamda doğrusal olmadığı kabul edilir. Dönüşümlerle doğrusala indirgenebilen diğerleri bu şekilde değerlendirilmez ve ekonometrik çalışmalarda en sık dikkate alınanlar onlardır. Aynı zamanda bu, ekonometride esas itibariyle doğrusal olmayan bağımlılıkların incelenmesinin imkansız olduğu anlamına da gelmez. Modelin parametreleri dahili olarak doğrusal değilse, parametreleri tahmin etmek için yinelemeli prosedürler kullanılır; bunun başarısı, kullanılan yinelemeli yöntemin özelliklerine ilişkin denklem türüne bağlıdır.

Doğrusala indirgenmiş bağımlılıklara dönelim. Hem parametrelerde hem de değişkenlerde doğrusal değilse, örneğin y = a çarpı X'in kuvveti şeklindeyse, bunun üssü -  (beta) parametresidir:

Açıkçası, böyle bir ilişki basit logaritmayla kolaylıkla doğrusal bir denkleme dönüştürülebilir.

Logaritmaları ifade eden yeni değişkenler dahil edildikten sonra doğrusal bir denklem elde edilir. Regresyonun tahmin edilmesine yönelik prosedür daha sonra, orijinal değerlerin logaritmaları alınarak her gözlem için yeni değişkenlerin hesaplanmasından oluşur. Daha sonra yeni değişkenlerin regresyon bağımlılığı tahmin edilir. Orijinal değişkenlere gitmek için antilogaritmayı almanız gerekir, yani aslında üsleri yerine üslerin kendilerine dönmelisiniz (sonuçta logaritma üstür). Üstel veya üstel fonksiyonların durumu da benzer şekilde düşünülebilir.

Önemli ölçüde doğrusal olmayan bir regresyon için, karşılık gelen ilişki doğrusala dönüştürülemediğinden olağan regresyon tahmin prosedürünü uygulamak mümkün değildir. Genel eylem şeması aşağıdaki gibidir:

1. Bazı makul başlangıç ​​parametre değerleri kabul edilir;

2. Tahmin edilen Y değerleri, bu parametre değerleri kullanılarak gerçek X değerlerinden hesaplanır;

3. Örnekteki tüm gözlemler için artıklar hesaplanır ve ardından artıkların kareleri toplanır;

4. Bir veya daha fazla parametre tahmininde küçük değişiklikler yapılır;

5. Y'nin yeni öngörülen değerleri, artıklar ve artıkların karelerinin toplamı hesaplanır;

6. Artıkların kareleri toplamı öncekinden küçükse, yeni parametre tahminleri öncekilerden daha iyidir ve yeni bir başlangıç ​​noktası olarak kullanılmalıdır;

7. 4, 5 ve 6. adımlar, artık karelerin toplamında bir değişikliğe yol açacak parametre tahminlerinde bu tür değişikliklerin yapılması imkansız hale gelinceye kadar tekrarlanır;

8. Artıkların kareleri toplamının minimize edildiği ve nihai parametre tahminlerinin en küçük kareler tahminleri olduğu sonucuna varılmıştır.

Doğrusal forma indirgenebilen doğrusal olmayan fonksiyonlar arasında güç fonksiyonu ekonometride yaygın olarak kullanılmaktadır. İçindeki b parametresinin esneklik katsayısı olarak net bir yorumu vardır. Tahmin edilen parametrelerde doğrusal olmayan ancak doğrusal forma indirgenebilen modellerde, dönüştürülen denklemlere en küçük kareler uygulanır. Logaritmaların ve buna bağlı olarak üslerin pratik kullanımı, ortaya çıkan işaretin negatif değerleri olmadığında mümkündür. Ortaya çıkan özelliğin logaritmasını kullanarak işlevler arasındaki ilişkileri incelerken, ekonometride güç yasası bağımlılıkları baskındır (arz ve talep eğrileri, üretim fonksiyonları, ürünlerin emek yoğunluğu, üretim ölçeği, bağımlılık arasındaki ilişkiyi karakterize eden emilim eğrileri). GSMH'nın istihdam düzeyine oranı, Engel eğrileri).

28. Ters model ve kullanımı

Bazen dahili olarak doğrusal olmayan ters model kullanılır, ancak eşkenar hiperbolden farklı olarak, dönüşüme tabi olan açıklayıcı değişken değil, sonuçta ortaya çıkan Y özelliğidir. Bu nedenle, ters model şu şekilde ortaya çıkıyor: dahili olarak doğrusal olmayan ve sonuçta ortaya çıkan Y özelliğinin gerçek değerleri ve bunların ters değerleri için OLS gereksinimi karşılanmaz. Doğrusal olmayan regresyon için korelasyon çalışması özel ilgiyi hak etmektedir. Genel durumda, ikinci dereceden bir parabol, daha yüksek dereceli polinomlar gibi, doğrusallaştırıldığında çoklu regresyon denklemi biçimini alır. Açıklanan değişkene göre doğrusal olmayan bir regresyon denklemi doğrusallaştırıldığında doğrusal ikili regresyon denklemi biçimini alırsa ilişkinin yakınlığını değerlendirmek için doğrusal bir korelasyon katsayısı kullanılabilir.

Regresyon denkleminin doğrusal forma dönüştürülmesi bağımlı değişkenle (sonuç karakteristik) ilişkilendirilirse, o zaman özelliklerin dönüştürülmüş değerlerine dayanan doğrusal korelasyon katsayısı, ilişkinin yalnızca yaklaşık bir değerlendirmesini verir ve sayısal olarak çakışmaz. korelasyon indeksi. Korelasyon indeksini hesaplarken, logaritmalarının değil, ortaya çıkan Y karakteristiğinin karesel sapmalarının toplamlarının kullanıldığı akılda tutulmalıdır. Korelasyon endeksinin öneminin değerlendirilmesi, korelasyon katsayısının güvenilirliğinin (anlamlılığının) değerlendirilmesiyle aynı şekilde gerçekleştirilir. Korelasyon indeksinin kendisi, belirleme indeksi gibi, Fisher F testi kullanılarak doğrusal olmayan regresyon denkleminin genel anlamlılığını test etmek için kullanılır.

Doğrusal olmayan modelleri hem doğrusal forma indirgeyerek hem de doğrusal olmayan regresyon kullanarak oluşturma olasılığının bir yandan regresyon analizinin evrenselliğini artırdığını unutmayın. Öte yandan araştırmacının görevlerini önemli ölçüde karmaşıklaştırıyor. Kendimizi eşleştirilmiş regresyon analiziyle sınırlandırırsak, Y ve X gözlemlerini bir dağılım grafiği olarak çizebiliriz. Çoğunlukla birkaç farklı doğrusal olmayan fonksiyon, eğer bir eğri üzerinde yer alıyorlarsa, gözlemlere yaklaşırlar. Ancak çoklu regresyon analizi durumunda böyle bir grafik oluşturulamaz.

Bağımlı değişkenin aynı tanımına sahip alternatif modeller dikkate alındığında seçim prosedürü nispeten basittir. Hayal edilebilecek tüm makul fonksiyonlara dayanarak bir regresyon tahmin edilebilir ve bağımlı değişkendeki değişikliği en çok açıklayan fonksiyon seçilebilir. Doğrusal bir fonksiyon y'deki varyansın yaklaşık %64'ünü açıkladığında ve hiperbolik bir fonksiyon %99,9'unu açıkladığında, ikincisinin seçilmesi gerektiği açıktır. Ancak farklı modeller farklı işlevsel formlar kullandığında, model seçimi sorunu önemli ölçüde daha karmaşık hale gelir.

29. Box-Cox testinin kullanılması.

Daha genel olarak, bağımlı değişkenin aynı tanımına sahip alternatif modelleri değerlendirirken seçim basittir. Bağımlı değişkendeki değişimi en çok açıklayan fonksiyona odaklanarak, tüm makul fonksiyonlara dayanarak regresyonu tahmin etmek en mantıklısıdır. Belirleme katsayısı, bir durumda regresyonla açıklanan varyansın oranını, diğerinde ise bu bağımlı değişkenin logaritmasının regresyonla açıklanan varyans oranını ölçerse, seçim zorlanmadan yapılır. İki model için bu değerlerin birbirine çok yakın olması ve seçim sorununun önemli ölçüde daha karmaşık hale gelmesi başka bir konudur.

Daha sonra Box-Cox testi formundaki standart prosedür uygulanmalıdır. Etkin faktörü ve logaritmasını bağımlı değişkenin bir varyantı biçiminde kullanarak modelleri karşılaştırmanız gerekiyorsa, Zarembka testinin bir versiyonu kullanılır. Doğrusal ve logaritmik modellerde ortalama kare hatanın (MSE) doğrudan karşılaştırılmasına olanak tanıyan gözlem ölçeği Y'nin bir dönüşümünü önerir. İlgili prosedür aşağıdaki adımları içerir:

    Örnekteki Y değerlerinin geometrik ortalaması hesaplanır; bu, Y'nin logaritmasının aritmetik ortalamasının üssüne denk gelir;

    Y gözlemleri, ilk adımda elde edilen değere bölünecek şekilde yeniden hesaplanır;

    Regresyon, orijinal Y değerleri yerine ölçeklendirilmiş Y değerleri kullanılarak doğrusal bir model için ve ölçeklendirilmiş Y değerlerinin logaritması kullanılarak logaritmik bir model için tahmin edilir. İki regresyonun RMSE değerleri artık karşılaştırılabilir ve bu nedenle. sapmaların kareleri toplamı daha küçük olan model, gözlemlenen değerlerin gerçek ilişkisine daha iyi uyum sağlar;

    Modellerden birinin önemli ölçüde daha iyi bir uyum sağlamadığını kontrol etmek için, gözlem sayısının yarısının çarpımı ve yeniden hesaplanan regresyonlarda standart sapma değerlerinin oranının logaritması kullanılabilir ve ardından Bu değerin mutlak değeri.

30. Faktörlerin karşılıklı korelasyonu ve çoklu bağlantı kavramları.

34. ÇUŞ'un temelleri ve uygulamasının geçerliliği.

Şimdi OLS'nin temellerine, uygulamasının geçerliliğine (çoklu regresyon problemleri dahil) ve OLS kullanılarak elde edilen tahminlerin en önemli özelliklerine dönelim. Regresyon denkleminin sağ tarafındaki analitik bağımlılığın yanı sıra rastgele terimin de önemli bir rol oynadığı gerçeğiyle başlayalım. Bu rastgele bileşen gözlemlenemeyen bir miktardır. Regresyon parametrelerinin ve korelasyon göstergelerinin istatistiksel testleri, çoklu regresyonun bu rastgele bileşeninin dağılımı hakkındaki test edilemeyen varsayımlara dayanmaktadır. Bu varsayımlar yalnızca ön hazırlık niteliğindedir. Yalnızca regresyon denklemi oluşturulduktan sonra, rastgele artıkların tahminlerinin (rastgele bileşenin ampirik analogları) önceden varsayılan özelliklere sahip olup olmadığı kontrol edilir. Temel olarak, model parametreleri tahmin edilirken, rastgele bileşenin kendisini tahmin etmek için ortaya çıkan özelliğin teorik ve gerçek değerleri arasındaki farklar hesaplanır. Bunun sadece belirli bir denklemin bilinmeyen geri kalanının örnek bir uygulaması olduğunu akılda tutmak önemlidir.

Normal denklemler sisteminden elde edilen regresyon katsayıları ilişkinin gücüne ilişkin örnek tahminlerdir. Ancak tarafsız olduklarında pratik öneme sahip oldukları açıktır. Bu durumda artıkların ortalamasının sıfıra eşit olduğunu veya aynı şekilde tahminin ortalamasının tahmin edilen parametrenin kendisine eşit olduğunu hatırlayın. Bu durumda artıklar çok sayıda örnek tahmin üzerinde birikmeyecektir ve bulunan regresyon parametresinin kendisi çok sayıda tarafsız tahminin ortalaması olarak kabul edilebilecektir.

Ayrıca tahminlerin en küçük varyansa sahip olması gerekir; etkili olabilir ve daha sonra pratik olarak uygun olmayan nokta tahminlerinden aralık tahminine geçmek mümkün hale gelir. Son olarak güven aralıkları, parametrenin gerçek (bilinmeyen) değerinden belirli bir mesafede bir tahmin elde etme olasılığı bire yakın olduğunda kullanışlıdır. Bu tür tahminlere tutarlı denir ve tutarlılık özelliği, örneklem büyüklüğünün artmasıyla doğruluklarının artmasıyla karakterize edilir.

Ancak tutarlılık koşulunun otomatik olarak karşılanmaması, önemli ölçüde aşağıdaki iki önemli şartın yerine getirilmesine bağlıdır. İlk olarak, artıkların kendileri en belirgin rastlantısallıkla stokastik olmalıdır; açıkça işlevsel olan tüm bağımlılıklar, özellikle çoklu regresyonun analitik bileşenine dahil edilmelidir ve ayrıca, artıkların değerleri, farklı numuneler için birbirinden bağımsız olarak dağıtılmalıdır (artıklarda otokorelasyon yoktur). İkincisi, daha az önemli olmayan gereklilik, her sapmanın (artık) varyansının, X değişkenlerinin tüm değerleri için (homoskedastisite) aynı olmasıdır. Onlar. Eş varyans, tüm gözlemler için varyansın sabitliği ile ifade edilir:

Aksine, değişen varyans, farklı gözlemler için bu tür varyans sabitliğinin ihlalidir. Bu durumda, numunedeki farklı gözlemler için rastgele terimin farklı teorik dağılımlarıyla yüksek derecede sapma değerleri elde etme a priori (gözlemlerden önce) olasılığı nispeten yüksek olacaktır.

Artıkların otokorelasyonu veya mevcut ve önceki (sonraki) gözlemlerin artıkları arasında bir korelasyonun varlığı, olağan doğrusal korelasyon katsayısının değeriyle belirlenir. Sıfırdan önemli ölçüde farklıysa, artıklar otokorelasyona tabi tutulur ve bu nedenle olasılık yoğunluk fonksiyonu (artık dağılımı) gözlem noktasına ve diğer gözlem noktalarındaki kalıntı değerlerin dağılımına bağlıdır. Gözlemlerin X faktörüne göre sıralanması durumunda, artıkların otokorelasyonunun mevcut istatistiksel bilgileri kullanarak belirlenmesi uygundur. Artıkların otokorelasyonunun olmaması, regresyon katsayıları tahminlerinin tutarlılığını ve etkinliğini sağlar.

35. Homoskedastisite ve değişen varyans, artıkların otokorelasyonu, genelleştirilmiş en küçük kareler (GLM).

X değişkenlerinin tüm değerleri için artıkların varyanslarının aynılığı veya eş varyanslılık, OLS kullanarak regresyon parametrelerinin tutarlı tahminlerini elde etmek için kesinlikle gereklidir. Eş varyans koşulunun sağlanamaması, heteroskedastisite olarak adlandırılan duruma yol açar. Regresyon katsayılarının taraflı tahminlerine yol açabilir. Değişen varyans esas olarak regresyon katsayısı tahminlerinin etkinliğindeki azalmayı etkileyecektir. Bu durumda, regresyon katsayısının standart hatası formülünü kullanmak özellikle zorlaşır; bunun kullanımı, faktörün herhangi bir değeri için artıkların düzgün bir şekilde dağıldığını varsayar. Regresyon katsayılarının tahminlerinin tarafsızlığına gelince, bu öncelikle artıkların bağımsızlığına ve faktörlerin değerlerine bağlıdır.

Eş varyanslılığı test etmenin oldukça açık, titiz olmayan ve beceri gerektiren bir yolu, artıkların ortalama hesaplanan (teorik) sonuç niteliğine veya karşılık gelen korelasyon alanlarına bağımlılığının doğasını grafiksel olarak incelemektir. Heteroskedasticity'yi incelemek ve değerlendirmek için analitik yöntemler daha titizdir. Önemli bir heteroskedastisite varlığı varsa, OLS yerine genelleştirilmiş OLS (GLM) kullanılması tavsiye edilir.

OLS kullanımından kaynaklanan çoklu regresyon gerekliliklerinin yanı sıra modelde yer alan değişkenlere ilişkin koşullara da uyulması gerekmektedir. Bunlar, her şeyden önce, belirli bir gözlem hacmi için (1'den 7'ye kadar) model faktörlerinin sayısına ilişkin gereklilikleri içerir. Aksi takdirde regresyon parametreleri istatistiksel olarak anlamsız olacaktır. LSM'yi uygularken karşılık gelen sayısal yöntemlerin uygulanmasının etkinliği açısından, gözlem sayısının tahmin edilen parametrelerin sayısını aşması gerekir (bir denklem sisteminde denklem sayısı, aranan sayıdan daha fazladır) değişkenler).

Ekonometrinin en önemli başarısı, bilinmeyen parametrelerin tahmin edilmesine yönelik yöntemlerin önemli ölçüde geliştirilmesi ve söz konusu etkilerin statik öneminin belirlenmesine yönelik kriterlerin iyileştirilmesidir. Bu bağlamda, bir dereceye kadar ortaya çıkan değişen varyans nedeniyle geleneksel OLS'yi kullanmanın imkansızlığı veya yersizliği, genelleştirilmiş bir OLS'nin (GLM) geliştirilmesine yol açtı. Aslında bu, regresyon katsayılarının tarafsız, verimli ve tutarlı tahminlerini sağlamak için modelin ayarlanmasını, spesifikasyonunun değiştirilmesini ve orijinal verilerin dönüştürülmesini içerir.

Artıkların ortalamasının sıfır olduğu, ancak dağılımlarının artık sabit olmadığı, ancak K i değerleriyle orantılı olduğu varsayılmaktadır; burada bu değerler, farklı değerler için farklı olan orantı katsayılarıdır. faktör x. Dolayısıyla dağılımın heterojenliğini karakterize eden bu katsayılardır (K i değerleri). Doğal olarak bu orantı katsayılarının ortak faktörü olan dağılım miktarının bilinmediğine inanılmaktadır.

Orijinal model, bu katsayıları çoklu regresyon denklemine dahil ettikten sonra heteroskedastik kalmaya devam ediyor (daha doğrusu bunlar modelin artık değerleridir). Bu artıkların (artıklar) otokorelasyona uğramamasına izin verin. İ'inci gözlem sonucunda kaydedilen başlangıç ​​model değişkenlerini Ki orantı katsayılarının kareköküne bölerek elde edilen yeni değişkenleri tanıtalım. Daha sonra, dönüştürülmüş değişkenlerde, artıkların eşit varyanslı olacağı yeni bir denklem elde ederiz. Yeni değişkenlerin kendileri ağırlıklı eski (orijinal) değişkenlerdir.

Dolayısıyla bu şekilde elde edilen yeni denklemin parametrelerinin homoskedastik artıklarla tahmini, ağırlıklı en küçük kareler yöntemine (özünde bu OLS yöntemidir) indirgenecektir. Regresyon değişkenlerinin kendileri yerine kullanıldığında, ortalamalardan sapmaları, regresyon katsayıları için ifadeler basit ve standartlaştırılmış (tekdüze) bir form alır; bu, OLS ve OLS için paydaki 1/K düzeltme faktörü ile biraz farklılık gösterir ve Regresyon katsayısını veren kesrin paydası.

Dönüştürülen (ayarlanan) modelin parametrelerinin, orantılılık katsayıları K i'nin temeli olarak hangi kavramın kullanıldığına önemli ölçüde bağlı olduğu unutulmamalıdır. Çoğu zaman artıkların faktör değerleriyle orantılı olduğu varsayılır. Model, hataların sırasıyla son faktörün değerleriyle orantılı olduğu hipotezi kabul edildiğinde en basit şeklini alır. Daha sonra OLS, standart OLS'nin orijinal kaynak değişkenlerle çalışmasına kıyasla regresyon parametrelerini belirlerken dönüştürülmüş değişkenlerin daha küçük değerleriyle gözlemlerin ağırlığını arttırmayı mümkün kılar. Ancak bu yeni değişkenler halihazırda farklı bir ekonomik içeriğe sahip.

Artıkların faktörün büyüklüğüyle orantılılığı hakkındaki hipotezin gerçek bir temeli olabilir. Örneğin, büyük ve küçük işletmeler de dahil olmak üzere, yeterince homojen olmayan belirli bir veri kümesinin aynı anda işlenmesine izin verin. Daha sonra faktörün büyük hacimsel değerleri, hem ortaya çıkan özelliğin büyük bir dağılımına hem de artık değerlerin büyük bir dağılımına karşılık gelebilir. Ayrıca, OLS'nin kullanılması ve ilgili değerlere karşılık gelen geçiş, yalnızca faktör değişimini azaltmakla kalmaz, aynı zamanda hata varyansını da azaltır. Böylece, regresyon modellerinde değişen varyansın dikkate alınması ve düzeltilmesinin en basit durumu OLS'nin kullanılmasıyla gerçekleştirilir.

OLS'yi ağırlıklı OLS biçiminde uygulamaya yönelik yukarıdaki yaklaşım oldukça pratiktir; basit bir şekilde uygulanır ve şeffaf bir ekonomik yoruma sahiptir. Elbette bu en genel yaklaşım değil ve ekonometrinin teorik temelini oluşturan matematiksel istatistik bağlamında bize OLS'yi en genel haliyle uygulayan çok daha titiz bir yöntem sunuluyor. İçinde hata vektörünün (artık sütun) kovaryans matrisini bilmeniz gerekir. Ve bu genellikle pratik durumlarda adaletsizdir ve bu matrisi bu şekilde bulmak imkansız olabilir. Bu nedenle, genel olarak konuşursak, böyle bir tahminin matrisin kendisi yerine karşılık gelen formüllerde kullanılabilmesi için gerekli matrisin bir şekilde tahmin edilmesi gerekir. Dolayısıyla, OMNC'nin uygulanmasının açıklanan versiyonu bu tür tahminlerden birini temsil etmektedir. Bazen erişilebilir genelleştirilmiş en küçük kareler olarak da adlandırılır.

OLS kullanılırken belirleme katsayısının uyum kalitesinin tatmin edici bir ölçüsü olarak hizmet edemeyeceği de dikkate alınmalıdır. OLS kullanımına dönersek, standart sapmaları (standart hatalar) Beyaz formda kullanma yönteminin (heteroskedastisite varlığında sözde tutarlı standart hatalar) yeterli genelliğe sahip olduğunu da not ediyoruz. Bu yöntem, hata vektörünün kovaryans matrisinin köşegen olması koşuluyla uygulanabilir. Artıkların (hataların) otokorelasyonu varsa, kovaryans matrisinde ve ana köşegenin dışında sıfır olmayan öğeler (katsayılar) olduğunda, Neve West formunda daha genel bir standart hata yöntemi kullanılmalıdır. Önemli bir sınırlama vardır: ana köşegene ek olarak sıfır olmayan öğeler yalnızca ana köşegenden belirli bir miktardan fazla aralıklı olmayan bitişik köşegenlerde bulunur.

Yukarıdakilerden, verileri heteroskedastisite açısından kontrol edebilmenin gerekli olduğu açıktır. Aşağıdaki testler bu amaca hizmet etmektedir. Artıkların varyanslarının eşitliği hakkındaki ana hipotezi, alternatif hipoteze (bu hipotezlerin eşitsizliğine ilişkin) karşı test ederler. Ek olarak, değişen varyanslılığın doğası üzerinde a priori yapısal kısıtlamalar vardır. Goldfeld-Quandt testi genellikle hata varyansının (artık) bazı bağımsız değişkenlerin değerine doğrudan bağlı olduğu varsayımını kullanır. Bu testi kullanma şeması aşağıdaki gibidir. İlk olarak veriler, değişen varyanstan şüphelenilen bağımsız değişkene göre azalan şekilde sıralanır. Bu sıralı veri seti daha sonra ortalama birkaç gözlemi ortadan kaldırır; burada "birkaç" kelimesi, tüm gözlemlerin toplam sayısının yaklaşık dörtte biri (%25) anlamına gelir. Daha sonra, kalan (eleme sonrasında) ortalama gözlemlerin ilki ve bu kalan ortalama gözlemlerin son ikisi üzerinde iki bağımsız regresyon gerçekleştirilir. Bundan sonra karşılık gelen iki kalan oluşturulur. Son olarak Fisher F istatistiği derlenir ve eğer incelenen hipotez doğruysa, o zaman F gerçekten de uygun serbestlik derecelerine sahip Fisher dağılımıdır. O halde bu istatistiğin büyük bir değeri, test edilen hipotezin reddedilmesi gerektiği anlamına gelir. Eleme adımı olmadan bu testin gücü azalır.

Breusch-Pagan testi, varyansların bazı ek değişkenlere bağlı olduğunun önceden varsayıldığı durumlarda kullanılır. İlk olarak sıradan (standart) regresyon gerçekleştirilir ve artıkların bir vektörü elde edilir. Daha sonra varyansın tahmini oluşturulur. Daha sonra, artıkların kare vektörünün ampirik varyansa (varyans tahmini) bölünmesiyle elde edilen regresyon gerçekleştirilir. Bunun için (regresyon) varyasyonun açıklanan kısmı bulunur. Ve varyasyonun bu açıklanan kısmı için ikiye bölünmüş istatistikler oluşturulmuştur. Sıfır hipotezi doğruysa (hiçbir değişen varyans doğru değilse), o zaman bu değer bir dağılıma sahiptir hee-kare. Aksine, test heteroskedastisiteyi ortaya çıkarırsa, o zaman orijinal model, artıklar vektörünün bileşenlerinin, gözlemlenen bağımsız değişkenler vektörünün karşılık gelen bileşenlerine bölünmesiyle dönüştürülür.

36. Beyaz formda standart sapma yöntemi.

Aşağıdaki sonuçlar çıkarılabilir. Heteroskedasticity varlığında OLS'nin kullanılması, ağırlıklı karesel sapmaların toplamını en aza indirmeye gelir. Mevcut OLS'nin kullanımı, tahmin edilen parametrelerin sayısını aşan çok sayıda gözleme sahip olma ihtiyacıyla ilişkilidir. OLS kullanımı için en uygun durum, hatanın (artıklar) bağımsız değişkenlerden biriyle orantılı olduğu ve ortaya çıkan tahminlerin tutarlı olduğu durumdur. Bununla birlikte, heteroskedastisiteye sahip bir modelde OLS değil standart OLS kullanılması gerekiyorsa, tutarlı tahminler elde etmek için White veya Nevier-West formundaki hata tahminleri kullanılabilir.

Zaman serilerini analiz ederken, zamanın farklı noktalarındaki gözlemlerin istatistiksel bağımlılığını genellikle hesaba katmak gerekir. Bu durumda korelasyonsuz hatalar varsayımı karşılanmamaktadır. Hataların birinci dereceden otoregresif bir süreç oluşturduğu basit bir modeli ele alalım. Bu durumda, hatalar basit bir yineleme ilişkisini karşılar; bunun sağ tarafında terimlerden biri, sıfır ortalamalı ve sabit varyanslı, bağımsız, normal dağılımlı rastgele değişkenlerin bir dizisidir. İkinci terim, parametrenin (otoregresyon katsayısı) ve artıkların önceki zaman noktasındaki değerlerinin çarpımıdır. Hata değerleri (artıklar) dizisinin kendisi durağan bir rastgele süreç oluşturur. Durağan bir rastgele süreç, karakteristiklerinin, özellikle ortalama ve varyansın zaman içindeki sabitliği ile karakterize edilir. Bu durumda bizi ilgilendiren kovaryans matrisi (terimleri) parametrenin kuvvetleri kullanılarak kolayca yazılabilir.

Bilinen bir parametre için otoregresif modelin tahmini OLS kullanılarak gerçekleştirilir. Bu durumda orijinal modeli basit bir dönüşümle hataları standart regresyon modelinin koşullarını karşılayan bir modele indirgemek yeterlidir. Çok nadirdir ancak yine de otoregresyon parametresinin bilindiği bir durum vardır. Bu nedenle genellikle bilinmeyen bir otoregresif parametre ile tahmin yapılması gerekmektedir. Bu değerlendirme için en sık kullanılan üç prosedür vardır. Cochrane-Orcutt yöntemi, Hildreth-Lu prosedürü ve Durbin yöntemi.

Genel olarak aşağıdaki sonuçlar doğrudur. Zaman serisi analizi geleneksel OLS'nin düzeltilmesini gerektirir çünkü bu durumda hatalar genellikle ilişkilidir. Genellikle bu hatalar birinci dereceden durağan otoregresif bir süreç oluşturur. Birinci dereceden otoregresyon için OLS tahmin edicileri tarafsızdır, tutarlıdır ancak etkisizdir. Bilinen bir otoregresyon katsayısı ile OLS, orijinal sistemin basit dönüşümlerine (düzeltmelerine) ve ardından standart OLS'nin uygulanmasına indirgenir. Çoğu zaman olduğu gibi otoregresif katsayı bilinmiyorsa, o zaman OLS için bilinmeyen parametrenin (katsayı) tahmin edilmesini içeren çeşitli prosedürler mevcuttur ve ardından bilinenin önceki durumunda olduğu gibi aynı dönüşümler uygulanır. parametre.

37. Breusch-Pagan testi kavramı, Goldfeldt-Quandt testi

Çeşitli tahmin yöntemleri arasında yaklaşıklık göz ardı edilemez. Onun yardımıyla orijinal nesneleri daha basit olanlarla değiştirerek yaklaşık hesaplamalar yapabilir ve planlanan göstergeleri hesaplayabilirsiniz. Excel'de bu yöntemi tahmin ve analiz amacıyla da kullanmak mümkündür. Yerleşik araçlar kullanılarak bu yöntemin belirtilen programda nasıl uygulanabileceğine bakalım.

Bu yöntemin adı Latince proxima - "en yakın" kelimesinden gelir. Bilinen göstergeleri basitleştirerek ve yumuşatarak, onları temelini oluşturan bir trend halinde sıralayarak yapılan bir yaklaşımdır. Ancak bu yöntem yalnızca tahminde bulunmak için değil aynı zamanda mevcut sonuçları incelemek için de kullanılabilir. Sonuçta, yaklaşıklaştırma özünde orijinal verilerin basitleştirilmesidir ve basitleştirilmiş versiyonun incelenmesi daha kolaydır.

Excel'de yumuşatmanın gerçekleştirildiği ana araç, bir trend çizgisinin oluşturulmasıdır. Sonuç olarak, mevcut göstergelere dayanarak gelecek dönemlere ait fonksiyon grafiği tamamlanmıştır. Tahmin edebileceğiniz gibi trend çizgisinin temel amacı tahminlerde bulunmak veya genel bir trendi belirlemektir.

Ancak beş tür yaklaşımdan biri kullanılarak oluşturulabilir:

  • Doğrusal;
  • Üstel;
  • Logaritmik;
  • Polinom;
  • Güçlü.

Seçeneklerin her birini ayrı ayrı daha ayrıntılı olarak ele alalım.

Yöntem 1: Doğrusal yumuşatma

Öncelikle yaklaşımın en basit versiyonuna, yani doğrusal fonksiyon kullanımına bakalım. Diğer yöntemlerin genel özelliklerini, yani bir programın oluşturulmasını ve sonraki seçenekleri değerlendirirken üzerinde durmayacağımız diğer bazı nüansları özetleyeceğimiz için, bunun üzerinde daha ayrıntılı olarak duracağız.

Öncelikle yumuşatma prosedürünü uygulayacağımız bir grafik oluşturacağız. Bir grafik oluşturmak için işletmenin ürettiği birim üretim başına aylık maliyeti ve belirli bir dönemde buna karşılık gelen karı gösteren bir tablo alalım. Oluşturacağımız grafik fonksiyon, kârdaki artışın üretim maliyetlerindeki düşüşe bağlılığını gösterecektir.


Bu durumda kullanılan yumuşatma aşağıdaki formülle açıklanmaktadır:

Özel durumumuzda formül aşağıdaki formu alır:

y=-0,1156x+72,255

Yaklaşım güvenirlik değerimiz şuna eşittir: 0,9418 Bu oldukça kabul edilebilir bir sonuç olup, yumuşatmayı güvenilir olarak nitelendirmektedir.

Yöntem 2: üstel yaklaşım

Şimdi Excel'deki üstel yaklaşım türüne bakalım.


Düzeltme fonksiyonunun genel görünümü aşağıdaki gibidir:

Nerede e doğal logaritmanın temelidir.

Özel durumumuzda formül aşağıdaki formu aldı:

y=6282,7*e^(-0,012*x)

Yöntem 3: Logaritmik yumuşatma

Şimdi logaritmik yaklaşım yöntemini dikkate alma sırası geldi.


Genel olarak yumuşatma formülü şöyle görünür:

Nerede içinde doğal logaritmanın değeridir. Dolayısıyla yöntemin adı.

Bizim durumumuzda formül aşağıdaki formu alır:

y=-62,81ln(x)+404,96

Yöntem 4: Polinom yumuşatma

Şimdi polinom yumuşatma yöntemini düşünmenin zamanı geldi.


Bu tür yumuşatmayı açıklayan formül aşağıdaki formu alır:

y=8E-08x^6-0,0003x^5+0,3725x^4-269,33x^3+109525x^2-2E+07x+2E+09

Yöntem 5: Güç yumuşatma

Son olarak Excel'deki güç yaklaşımı yöntemine bakalım.


Bu yöntem, fonksiyon verilerinde yoğun değişiklik olduğu durumlarda etkili bir şekilde kullanılır. Bu seçeneğin yalnızca işlev ve bağımsız değişkenin negatif veya sıfır değerleri kabul etmemesi durumunda uygulanabileceğini unutmamak önemlidir.

Bu yöntemi açıklayan genel formül aşağıdaki gibidir:

Özel durumumuzda şöyle görünür:

y = 6E+18x^(-6,512)

Gördüğünüz gibi, örnek olarak kullandığımız belirli verileri kullanırken, en yüksek düzeyde güvenilirlik, polinomun altıncı kuvvetiyle polinom yaklaşımı yöntemiyle gösterilmiştir ( 0,9844 ), doğrusal yöntem en düşük güvenilirliğe sahiptir ( 0,9418 ). Ancak bu, başka örnekler kullanıldığında da aynı eğilimin ortaya çıkacağı anlamına kesinlikle gelmiyor. Hayır, yukarıdaki yöntemlerin etkililik düzeyi, trend çizgisinin oluşturulacağı belirli fonksiyon türüne bağlı olarak önemli ölçüde değişebilir. Bu nedenle, seçilen yöntemin bu işlev için en etkili yöntem olması, başka bir durumda da en uygun olacağı anlamına gelmez.

Yukarıdaki önerilere dayanarak, sizin durumunuza özel olarak hangi tür yaklaşımın uygun olduğunu henüz hemen belirleyemiyorsanız, tüm yöntemleri denemek mantıklı olacaktır. Bir trend çizgisi oluşturduktan ve güven seviyesini inceledikten sonra en iyi seçeneği seçebilirsiniz.

Kurs

"Ekonometri" disiplininde

« İşletmelerin finansal ve ekonomik performans göstergeleri arasındaki ilişkinin kapsamlı analizi"

Seçenek No. 12

Tamamlanmış:

EET-312 grubunun öğrencisi

Logunov N.Yu.

Kontrol edildi:

Doç. Ishkhanyan M.V.

Moskova 2015

Sorunun beyanı

1. Korelasyon matrisinin derlenmesi. Faktörlerin seçimi

2. Çoklu doğrusal regresyon denkleminin oluşturulması. Denklem parametrelerinin yorumlanması

3. Belirleme katsayısı, çoklu korelasyon katsayısı

4. Çoklu doğrusal regresyon denkleminin kalitesinin değerlendirilmesi

4.1.Yaklaşımın ortalama bağıl hatası

4.2.Fisher's F testi kullanılarak çoklu regresyon denkleminin bir bütün olarak istatistiksel anlamlılığının kontrol edilmesi

4.3.Çoklu regresyon denklemindeki parametrelerin istatistiksel anlamlılığının kontrol edilmesi. Aralık parametre tahminleri

5.Regresyon modelinin uygulanması

5.1.Nokta tahmini

5.2.Kısmi esneklik katsayıları ve ortalama kısmi esneklik katsayıları

6. Regresyon modeli artıklarının analizi (Gauss-Markov teoreminin öncüllerinin kontrol edilmesi)

6.1 Artıkların matematiksel beklentisinin tahminleri.

6.2.Artıklarda otokorelasyonun kontrol edilmesi

7. Gregory Chow kriteri

Sorunun beyanı

53 işletmenin ekonomik faaliyetini karakterize eden 6 göstergenin değerleri belirtildi. Gerekli:

1. Bir korelasyon matrisi oluşturun. Bağımsız değişkenler kümesini ayarlayın (2 faktör seçin).

4.2. Fisher F testini kullanarak çoklu regresyon denkleminin istatistiksel önemini bir bütün olarak test edin. Sonuç çıkarmak

4.3. Çoklu regresyon denkleminin parametrelerinin istatistiksel önemini kontrol edin. Parametrelerin aralık tahminlerini oluşturun. Sonuç çıkarın.



5. Regresyon modelinin uygulanması:

5.1. Oluşturulan denklemi kullanarak bir nokta tahmini verin. Çalışılan parametre y'nin değerini bulun, eğer birinci faktörün değeri (y ile en yakından ilişkili olan) ortalama değerinin %110'u ise, ikinci faktörün değeri ortalama değerinin %80'idir. Sonucun ekonomik yorumunu yapınız.

5.2. Kısmi esneklik katsayılarını ve ortalama kısmi esneklik katsayılarını bulun. Sonuçları yorumlayın. Sonuç çıkarın.

6. Regresyon modelinin artıklarını analiz edin (Gauss-Markov teoreminin gerekliliklerini kontrol edin):

6.1. Artıkların matematiksel beklentisine ilişkin tahminleri bulun.

6.2. Artıklarda otokorelasyonu kontrol edin. Bir sonuç çıkarın.

7. Numuneyi iki eşit parçaya bölün. İlk ve son gözlemleri bağımsız örnekler olarak kabul ederek, bunları tek bir örnekte birleştirme olasılığı hakkındaki hipotezi Gregory-Chow kriterini kullanarak test edin.

Korelasyon matrisinin oluşturulması. Faktörlerin seçimi

İşletme No. Y3 X10 X12 X5 X7 X13
13,26 1,45 167,69 0,78 1,37
10,16 1,3 186,1 0,75 1,49
13,72 1,37 220,45 0,68 1,44
12,85 1,65 169,3 0,7 1,42
10,63 1,91 39,53 0,62 1,35
9,12 1,68 40,41 0,76 1,39
25,83 1,94 102,96 0,73 1,16
23,39 1,89 37,02 0,71 1,27
14,68 1,94 45,74 0,69 1,16
10,05 2,06 40,07 0,73 1,25
13,99 1,96 45,44 0,68 1,13
9,68 1,02 41,08 0,74 1,1
10,03 1,85 136,14 0,66 1,15
9,13 0,88 42,39 0,72 1,23
5,37 0,62 37,39 0,68 1,39
9,86 1,09 101,78 0,77 1,38
12,62 1,6 47,55 0,78 1,35
5,02 1,53 32,61 0,78 1,42
21,18 1,4 103,25 0,81 1,37
25,17 2,22 38,95 0,79 1,41
19,4 1,32 81,32 0,77 1,35
1,48 67,26 0,78 1,48
6,57 0,68 59,92 0,72 1,24
14,19 2,3 107,34 0,79 1,40
15,81 1,37 512,6 0,77 1,45
5,23 1,51 53,81 0,8 1,4
7,99 1,43 80,83 0,71 1,28
17,5 1,82 59,42 0,79 1,33
17,16 2,62 36,96 0,76 1,22
14,54 1,75 91,43 0,78 1,28
6,24 1,54 17,16 0,62 1,47
12,08 2,25 27,29 0,75 1,27
9,49 1,07 184,33 0,71 1,51
9,28 1,44 58,42 0,74 1,46
11,42 1,4 59,4 0,65 1,27
10,31 1,31 49,63 0,66 1,43
8,65 1,12 391,27 0,84 1,5
10,94 1,16 258,62 0,74 1,35
9,87 0,88 75,66 0,75 1,41
6,14 1,07 123,68 0,75 1,47
12,93 1,24 37,21 0,79 1,35
9,78 1,49 53,37 0,72 1,4
13,22 2,03 32,87 0,7 1,2
17,29 1,84 45,63 0,66 1,15
7,11 1,22 48,41 0,69 1,09
22,49 1,72 13,58 0,71 1,26
12,14 1,75 63,99 0,73 1,36
15,25 1,46 104,55 0,65 1,15
31,34 1,6 222,11 0,82 1,87
11,56 1,47 25,76 0,8 1,17
30,14 1,38 29,52 0,83 1,61
19,71 1,41 41,99 0,7 1,34
23,56 1,39 78,11 0,74 1,22

1.Bir korelasyon matrisi oluşturun. Bağımsız değişkenler kümesini ayarlayın (2 faktör seçin).

Ortaya çıkan işareti ele alalım Y3 ve faktör özellikleri X10, X12, X5, X7, X13 .

MS Excel’de “Veri Analizi→Korelasyon” seçeneğini kullanarak bir korelasyon matrisi oluşturalım:

Y3 X10 X12 X5 X7 X13
Y3 1,0000 0,3653 0,0185 0,2891 0,1736 0,0828
X10 0,3653 1,0000 -0,2198 -0,0166 -0,2061 -0,0627
X12 0,0185 -0,2198 1,0000 0,2392 0,3796 0,6308
X5 0,2891 -0,0166 0,2392 1,0000 0,4147 0,0883
X7 0,1736 -0,2061 0,3796 0,4147 1,0000 0,1939
X13 0,0828 -0,0627 0,6308 0,0883 0,1939 1,0000

Kriterlere göre 2 faktör seçiyoruz:

1) Y ve X arasındaki bağlantı maksimum olmalıdır

2) Xmi arasındaki bağlantı minimum düzeyde olmalıdır

Bu nedenle ilerleyen paragraflarda faktörlerle çalışma yapılacaktır. X10 , X5.

Çoklu doğrusal regresyon denkleminin oluşturulması. Denklem parametrelerinin yorumlanması.

2. Çoklu doğrusal regresyon denklemi oluşturun. Denklemin parametrelerinin yorumunu verin.

MS Excel'deki “Veri Analizi→Regresyon” analiz paketini kullanarak bir regresyon modeli oluşturalım:

Oranlar
e -20,7163
X 10 5,7169
X 5 34,9321

Regresyon denklemi şöyle görünecektir:

ŷ = b 0 + b 10 * x 10 + b 5 * x 5

ŷ = -20,7163-5,7169* x 10 +34,9321* x 5

1) b10 pozitiftir;

2) b5 pozitiftir;

Belirleme katsayısı, çoklu korelasyon katsayısı

3. Belirleme katsayısını, çoklu korelasyon katsayısını bulun. Sonuç çıkarın.

MS Excel'deki “Veri Analizi→Regresyon” analiz paketi kullanılarak gerçekleştirilen regresyon analizinde “Regresyon istatistikleri” tablosunu buluyoruz:

Y3 ile X10,X5 arasındaki çoklu R bağlantısı zayıf

Y özelliğindeki varyasyonun R-kare-%22,05'i, X10 ve X5 özelliklerindeki varyasyonla açıklanmaktadır

Çoklu doğrusal regresyon denkleminin kalitesini değerlendirme

4. Çoklu doğrusal regresyon denkleminin kalitesini değerlendirin:

Ortalama bağıl yaklaşım hatası

4.1. Ortalama bağıl yaklaşım hatasını bulun. Sonuç çıkarın.

MS Excel'de “Veri Analizi→Regresyon” analiz paketi kullanılarak yapılan regresyon analizinde her bir gözlem için tahmin edilen değerleri hesaplayalım veya “Artık Çıktı” tablosundaki “Tahmini Y” sütununu kullanalım.

Her gözlem için göreceli hataları aşağıdaki formülü kullanarak hesaplayalım:

Ortalama bağıl yaklaşım hatasını aşağıdaki formülü kullanarak hesaplayalım:

Çözüm: 20% < А < 50%, качество уравнения среднее (удовлетворительное).

Korelasyon ve belirleme göstergeleri

Doğrusal çift regresyonu

Tabloda hesaplanan yardımcı verilere dayanmaktadır. 2, bağlantı yakınlığının göstergesini hesaplıyoruz.

Bu gösterge, formül kullanılarak hesaplanan örnek doğrusal korelasyon katsayısıdır.

Korelasyon katsayısı hesaplama sonuçlarına dayanarak, faktör ile ortaya çıkan özellik arasındaki ilişkinin doğrudan ve güçlü olduğu sonucuna varabiliriz (Chaddock ölçeğine göre).

Korelasyon katsayısının karesine, faktör özelliğindeki değişim tarafından açıklanan sonuç özellikteki değişimin oranını gösteren belirleme katsayısı adı verilir.

Genellikle belirleme katsayısını yorumlarken yüzde olarak ifade edilir.

R2 = 0,8472 = 0,7181

onlar. Vakaların %71,81'inde bir faktör özelliğindeki değişiklik, ortaya çıkan özellikte de değişikliğe yol açar. Regresyon denkleminin seçiminin doğruluğu oldukça yüksektir. Y'deki değişimin kalan %28,19'u modelde dikkate alınmayan faktörlerle açıklanmaktadır.

Güç çifti regresyonu

Güç çifti regresyonu için sonuç ve faktör özellikleri arasındaki ilişkinin yakınlığını korelasyon katsayısını kullanarak belirleriz:

Bilinen verileri değiştirerek şunu elde ederiz:

Belirleme göstergesi.

onlar. Vakaların %69'unda faktör özelliğindeki bir değişiklik, ortaya çıkan özellikte de değişikliğe yol açar. Regresyon denklemini uydurmanın doğruluğu ortalamadır. Y'deki değişimin kalan %31'i modelde dikkate alınmayan faktörlerle açıklanmaktadır.

Ortalama yaklaşım hatası

Doğrusal çift regresyonu

Mutlak yaklaşım hatasını kullanarak regresyon denkleminin kalitesini değerlendirelim. Ortalama yaklaşım hatası - hesaplanan değerlerin gerçek değerlerden ortalama sapması:

Güç çifti regresyonu

Ortalama yaklaşım hatası - hesaplanan değerlerin gerçek değerlerden ortalama sapması:

%5-%7 aralığındaki bir yaklaşım hatası, regresyon denkleminin orijinal verilere iyi bir şekilde uyduğunu gösterir.

Hata %7'den fazla olduğundan bu denklemin regresyon olarak kullanılması önerilmez.

Fisher's F testi kullanılarak regresyon modelleme sonuçlarının istatistiksel güvenilirliğinin tahmini

Doğrusal çift regresyonu

Belirleme katsayısı R2, doğrusal regresyon denkleminin bir bütün olarak anlamlılığını test etmek için kullanılır.

Bir regresyon modelinin öneminin test edilmesi, hesaplanan değeri, incelenen göstergenin orijinal gözlem serisinin varyansının oranı ve kalıntı dizisinin varyansının tarafsız tahmini olarak bulunan Fisher'in F testi kullanılarak gerçekleştirilir. bu model için.

k 1 =(m) ve k 2 =(n-m-1) serbestlik derecesi ile hesaplanan değer, belirli bir anlamlılık seviyesinde tablodaki değerden büyükse, model anlamlı kabul edilir.

Eşleştirilmiş doğrusal regresyonun istatistiksel önemi aşağıdaki algoritma kullanılarak değerlendirilir:

burada m=1 ikili regresyon için.

F'nin gerçek değeri >

Güç çifti regresyonu

Doğrusal çift regresyonuna benzer şekilde güç çifti regresyonunu da tahmin edeceğiz

burada m modeldeki faktörlerin sayısıdır.

1. Denklemin bir bütün olarak istatistiksel olarak anlamsız olduğuna dair boş bir hipotez öne sürülüyor: H 0: R 2 =0 anlamlılık düzeyi b'de.

2. F kriterinin gerçek değerini belirleyin:

burada m=1 ikili regresyon için.

3. Tablolanan değer, toplam kareler toplamı için serbestlik derecesi sayısının (daha büyük varyans) 1 olduğu ve kalan için serbestlik derecesi sayısı dikkate alınarak, belirli bir anlamlılık düzeyi için Fisher dağılım tablolarından belirlenir. Doğrusal regresyonda kareler toplamı (daha küçük varyans) n-2'dir.

F tablosu, belirli bir serbestlik derecesinde ve b anlamlılık düzeyinde, rastgele faktörlerin etkisi altında kriterin mümkün olan maksimum değeridir. Önem düzeyi b - doğru olması koşuluyla doğru hipotezi reddetme olasılığı. Genellikle b 0,05 veya 0,01'e eşit alınır.

4. F testinin gerçek değeri tablo değerinden küçükse sıfır hipotezini reddetmek için hiçbir neden olmadığını söylüyorlar.

Aksi takdirde sıfır hipotezi reddedilir ve (1-b) olasılığıyla denklemin bir bütün olarak istatistiksel anlamlılığına ilişkin alternatif hipotez kabul edilir.

Kriterin serbestlik dereceli tablo değeri:

k 1 =1 ve k 2 =8, F tablosu = 5.32

Gerçek değer F > F tablosu olduğundan, belirleme katsayısı istatistiksel olarak anlamlıdır (regresyon denkleminin bulunan tahmini istatistiksel olarak güvenilirdir).

Analiz sonuçlarına göre hem doğrusal çift regresyonu hem de güç çifti regresyonu için belirleme katsayılarının istatistiksel olarak anlamlı olduğu sonucuna varıyoruz.

Doğrusal çift regresyonun belirleme katsayısı (göstergesi) daha yüksek olduğundan, faktör ile ortaya çıkan karakteristik arasındaki ilişkiyi yeterince tanımladığına inanıyoruz.