Olasılık teorisi kuklalar için çözümlere örnekler. Olasılığın belirlenmesine ilişkin matematikte Birleşik Devlet Sınavından bir problem örneği

Bazı programcılar, düzenli ticari uygulamalar geliştirme alanında çalıştıktan sonra makine öğreniminde uzmanlaşmayı ve veri analisti olmayı düşünüyor. Genellikle belirli yöntemlerin neden işe yaradığını anlamıyorlar ve çoğu makine öğrenimi yöntemi sihir gibi görünüyor. Aslında makine öğrenimi matematiksel istatistiklere, o da olasılık teorisine dayanmaktadır. Bu nedenle bu yazıda olasılık teorisinin temel kavramlarına dikkat edeceğiz: olasılık, dağılım tanımlarına değineceğiz ve birkaç basit örneği analiz edeceğiz.

Olasılık teorisinin geleneksel olarak 2 bölüme ayrıldığını biliyor olabilirsiniz. Ayrık olasılık teorisi, sonlu (veya sayılabilir) sayıda olası davranış seçeneğine (zar atma, madeni para atma) sahip bir dağılımla tanımlanabilecek olayları inceler. Sürekli olasılık teorisi, örneğin bir parça veya daire gibi yoğun bir kümeye dağılmış olayları inceler.

Olasılık teorisi konusunu basit bir örnekle ele alabiliriz. Kendinizi bir nişancı geliştiricisi olarak hayal edin. Bu türdeki oyunların geliştirilmesinin ayrılmaz bir parçası atış mekaniğidir. Tüm silahların kesinlikle doğru bir şekilde ateş ettiği bir atıcının oyuncuların pek ilgisini çekmeyeceği açıktır. Bu nedenle silahınıza spread eklemek zorunludur. Ancak silah etki noktalarını basitçe rastgele belirlemek ince ayar yapılmasına izin vermeyecektir, bu nedenle oyun dengesini ayarlamak zor olacaktır. Aynı zamanda rastgele değişkenler ve bunların dağılımları kullanılarak bir silahın belirli bir yayılımda nasıl performans göstereceği analiz edilebilir ve gerekli ayarlamaların yapılmasına yardımcı olunabilir.

Temel sonuçların alanı

Diyelim ki birçok kez tekrarlayabileceğimiz rastgele bir deneyden (örneğin yazı tura atmak), bazı resmileştirilebilir bilgileri (tura veya yazı) çıkarabildiğimizi varsayalım. Bu bilgiye temel sonuç denir ve genellikle Ω (Omega) harfiyle gösterilen tüm temel sonuçların kümesini dikkate almak faydalıdır.

Bu alanın yapısı tamamen deneyin doğasına bağlıdır. Örneğin, yeterince büyük bir dairesel hedefe ateş etmeyi düşünürsek, temel sonuçların uzayı, kolaylık olması açısından, merkezi sıfıra yerleştirilen bir daire olacaktır ve sonuç, bu dairenin içindeki bir nokta olacaktır.

Ek olarak, temel sonuç kümeleri - olaylar dikkate alınır (örneğin, ilk ona ulaşmak, hedefi olan küçük yarıçaplı eşmerkezli bir dairedir). Ayrık durumda her şey oldukça basittir: Sonlu bir zaman içinde temel sonuçlar dahil veya hariç olmak üzere herhangi bir olayı elde edebiliriz. Sürekli durumda, her şey çok daha karmaşıktır: eklenebilen, çıkarılabilen, bölünebilen ve çarpılabilen basit gerçek sayılarla analoji yoluyla cebir adı verilen, dikkate alınması gereken oldukça iyi bir küme ailesine ihtiyacımız var. Cebirdeki kümeler kesişebilir ve birleştirilebilir ve işlemin sonucu cebirde olacaktır. Bu, tüm bu kavramların arkasında yatan matematik açısından çok önemli bir özelliktir. Minimal bir aile yalnızca iki kümeden oluşur; boş küme ve temel sonuçların uzayı.

Ölçü ve olasılık

Olasılık, çok karmaşık nesnelerin nasıl çalıştıklarını anlamadan davranışları hakkında çıkarımlar yapmanın bir yoludur. Dolayısıyla olasılık, bir sayıyı döndüren bir olayın (bu çok iyi kümeler ailesinden) bir fonksiyonu olarak tanımlanır; bu, böyle bir olayın gerçekte ne sıklıkta meydana gelebileceğinin bazı özellikleridir. Kesin olarak matematikçiler bu sayının sıfır ile bir arasında olması gerektiği konusunda hemfikirdi. Ek olarak, bu fonksiyonun gereksinimleri vardır: imkansız bir olayın olasılığı sıfırdır, tüm sonuç kümesinin olasılığı birimdir ve iki bağımsız olayı (ayrık kümeler) birleştirme olasılığı olasılıkların toplamına eşittir. Olasılığın diğer adı olasılık ölçüsüdür. En sık kullanılanı, uzunluk, alan, hacim kavramlarını herhangi bir boyuta (n-boyutlu hacim) genelleştiren ve dolayısıyla geniş bir küme sınıfına uygulanabilen Lebesgue ölçüsüdür.

Bir dizi temel sonuç, bir küme ailesi ve bir olasılık ölçüsünün toplamına birlikte denir. olasılık uzayı. Bir hedefe atış örneği için nasıl bir olasılık uzayı oluşturabileceğimizi düşünelim.

Kaçırılması imkansız olan R yarıçaplı büyük bir yuvarlak hedefe ateş etmeyi düşünün. Bir dizi temel olayla, merkezi R yarıçapının koordinatlarının orijininde olan bir daire oluşturuyoruz. Bir olayın olasılığını tanımlamak için alanı (iki boyutlu kümeler için Lebesgue ölçüsü) kullanacağımız için, ölçülebilir (bu ölçümün mevcut olduğu) kümeler ailesini kullanacağız.

Not Aslında bu teknik bir noktadır ve basit problemlerde ölçü ve kümeler ailesini belirleme süreci özel bir rol oynamaz. Ancak bu iki nesnenin var olduğunu anlamak gerekir çünkü olasılık teorisiyle ilgili birçok kitapta teoremler şu sözlerle başlar: “ (Ω,Σ,P) bir olasılık uzayı olsun...».

Yukarıda belirtildiği gibi, temel sonuçların tüm uzayının olasılığı bire eşit olmalıdır. Okuldan iyi bilinen bir formüle göre bir dairenin alanı (iki boyutlu Lebesgue ölçüsü, λ 2 (A) olarak adlandırdığımız, burada A bir olaydır) π *R 2'ye eşittir. Daha sonra P(A) = λ 2 (A) / (π *R 2) olasılığını ortaya koyabiliriz ve bu değer herhangi bir A olayı için zaten 0 ile 1 arasında olacaktır.

Hedefteki herhangi bir noktayı vurmanın eşit derecede olası olduğunu varsayarsak, atıcının hedefin bir alanını vurma olasılığının araştırılması bu setin alanını bulmaya gelir (buradan olasılık şu sonuca varabiliriz: Belirli bir noktaya çarpma oranı sıfırdır çünkü noktanın alanı sıfırdır).

Örneğin, atıcının ilk 10'a girme olasılığının ne olduğunu bulmak istiyoruz (A olayı - atıcı istenen seti tutturur). Modelimizde “on”, merkezi sıfır ve yarıçapı r olan bir daire ile temsil edilmektedir. O halde bu daireye girme olasılığı P(A) = λ 2 /(A)π *R 2 = π * r 2 /(π R 2)= (r/R) 2'dir.

Bu, "geometrik olasılık" problemlerinin en basit türlerinden biridir - bu problemlerin çoğu bir alan bulmayı gerektirir.

Rastgele değişkenler

Rastgele değişken, temel sonuçları gerçek sayılara dönüştüren bir fonksiyondur. Örneğin, ele alınan problemde, çarpma noktasından hedefin merkezine olan mesafe olan ρ(ω) rastgele değişkenini tanıtabiliriz. Modelimizin basitliği, temel sonuçların uzayını açıkça tanımlamamıza izin verir: Ω = (ω = (x,y) öyle sayılar ki x 2 +y 2 ≤ R 2 ) . O halde rastgele değişken ρ(ω) = ρ(x,y) = x 2 +y 2 .

Olasılıksal uzaydan soyutlama araçları. Dağıtım fonksiyonu ve yoğunluk

Uzayın yapısının iyi bilinmesi iyidir ancak gerçekte durum her zaman böyle değildir. Bir mekanın yapısı bilinse bile karmaşık olabilir. İfadeleri bilinmiyorsa rastgele değişkenleri tanımlamak için, F ξ (x) = P(ξ) ile gösterilen bir dağılım fonksiyonu kavramı vardır.< x) (нижний индекс ξ здесь означает случайную величину). Т.е. это вероятность множества всех таких элементарных исходов, для которых значение случайной величины ξ на этом событии меньше, чем заданный параметр x .

Dağıtım fonksiyonunun çeşitli özellikleri vardır:

  1. Öncelikle 0 ile 1 arasındadır.
  2. İkinci olarak, x argümanı arttığında azalmaz.
  3. Üçüncüsü, -x sayısı çok büyük olduğunda dağılım fonksiyonu 0'a yakındır ve x'in kendisi büyük olduğunda dağılım fonksiyonu 1'e yakındır.

Muhtemelen bu yapının anlamı ilk okunduğunda çok açık değildir. Yararlı bir özellik, dağıtım fonksiyonunun, bir miktarın bir aralıktan değer alma olasılığını aramanıza izin vermesidir. Yani, P (rastgele değişken ξ aralıktaki değerleri alır) = F ξ (b)-F ξ (a). Bu eşitliğe dayanarak aralığın a ve b sınırları yakınsa bu değerin nasıl değişeceğini inceleyebiliriz.

d = b-a olsun, sonra b = a+d olsun. Ve bu nedenle, F ξ (b) - F ξ (a) = F ξ (a+d) - F ξ (a) . Küçük d değerleri için yukarıdaki fark da küçüktür (eğer dağılım sürekliyse). p ξ (a,d)= (F ξ (a+d) - F ξ (a))/d oranını dikkate almak mantıklıdır. Yeterince küçük d değerleri için, bu oran d'den bağımsız olarak bazı sabit p ξ (a)'dan çok az farklıysa, o zaman bu noktada rastgele değişken p ξ (a)'ya eşit bir yoğunluğa sahiptir.

Not Türev kavramıyla daha önce karşılaşan okuyucular p ξ (a)'nın F ξ (x) fonksiyonunun a noktasında türevi olduğunu fark edebilirler. Her durumda, Mathprofi web sitesinde bu konuyla ilgili bir makalede türev kavramını inceleyebilirsiniz.

Şimdi dağılım fonksiyonunun anlamı şu şekilde tanımlanabilir: a noktasındaki türevi (yukarıda tanımladığımız yoğunluk p ξ), bir rastgele değişkenin a noktasında (a noktasının komşusu) merkezli küçük bir aralığa ne sıklıkla düşeceğini tanımlar. ) diğer noktaların mahalleleriyle karşılaştırıldığında . Başka bir deyişle, dağılım fonksiyonu ne kadar hızlı büyürse, rastgele bir deneyde böyle bir değerin ortaya çıkma olasılığı da o kadar artar.

Örneğe geri dönelim. Merkezden hedefteki rastgele isabet noktasına kadar olan mesafeyi ifade eden ρ(ω) = ρ(x,y) = x 2 +y 2 rastgele değişkeni için dağılım fonksiyonunu hesaplayabiliriz. Tanım gereği, F ρ (t) = P(ρ(x,y)< t) . т.е. множество {ρ(x,y) < t)} — состоит из таких точек (x,y) , расстояние от которых до нуля меньше, чем t . Мы уже считали вероятность такого события, когда вычисляли вероятность попадания в «десятку» - она равна t 2 /R 2 . Таким образом, Fρ(t) = P(ρ(x,y) < t) = t 2 /R 2 , для 0

Bu rastgele değişkenin yoğunluğunu p ρ bulabiliriz. Aralığın dışında sıfır olduğunu hemen belirtelim, çünkü bu aralıktaki dağıtım fonksiyonu değişmez. Bu aralığın sonunda yoğunluk belirlenmez. Aralığın içinde, bir türev tablosu (örneğin, Mathprofi web sitesinden) ve temel türev alma kuralları kullanılarak bulunabilir. t2/R2'nin türevi 2t/R2'ye eşittir. Bu, reel sayıların tüm eksenindeki yoğunluğu bulduğumuz anlamına gelir.

Yoğunluğun bir diğer yararlı özelliği, bir fonksiyonun bir aralıktan değer alma olasılığıdır ve bu aralıktaki yoğunluğun integrali kullanılarak hesaplanır (bunun ne olduğunu Mathprofi'deki uygun, uygunsuz ve belirsiz integrallerle ilgili makalelerde öğrenebilirsiniz). web sitesi).

İlk okumada f(x) fonksiyonunun bir aralığı üzerindeki integrali kavisli bir yamuğun alanı olarak düşünülebilir. Kenarları, Öküz ekseninin bir parçası, bir boşluk (yatay koordinat ekseni), eğri üzerindeki (a,f(a)), (b,f(b)) noktalarını (a,0) noktalarına bağlayan dikey bölümlerdir, (b,0 ) Ox ekseninde. Son taraf, f fonksiyonunun (a,f(a)) ile (b,f(b)) arasındaki grafiğinin bir parçasıdır. (-∞; b] aralığı boyunca integralden bahsedebiliriz, yeterince büyük negatif değerler için, a, aralıktaki integralin değeri, a sayısındaki değişime kıyasla ihmal edilebilir derecede değişecektir. Aralıklar üzerindeki integral, benzer şekilde tanımlanır)