Cách xây dựng hàm phân phối thực nghiệm dựa trên mẫu. Hàm phân phối theo kinh nghiệm

Xác định hàm phân phối thực nghiệm

Cho $X$ là một biến ngẫu nhiên. $F(x)$ là hàm phân phối của một biến ngẫu nhiên nhất định. Chúng ta sẽ thực hiện $n$ thí nghiệm trên một biến ngẫu nhiên cho trước trong cùng điều kiện, độc lập với nhau. Trong trường hợp này, chúng ta thu được một chuỗi các giá trị $x_1,\ x_2\ $, ... ,$\ x_n$, được gọi là mẫu.

Định nghĩa 1

Mỗi giá trị $x_i$ ($i=1,2\ $, ... ,$ \ n$) được gọi là một biến thể.

Một ước tính của hàm phân phối lý thuyết là hàm phân phối thực nghiệm.

Định nghĩa 3

Hàm phân phối thực nghiệm $F_n(x)$ là hàm xác định tần suất tương đối của sự kiện $X \ cho mỗi giá trị $x$

trong đó $n_x$ là số lượng tùy chọn nhỏ hơn $x$, $n$ là kích thước mẫu.

Sự khác biệt giữa hàm thực nghiệm và hàm lý thuyết là hàm lý thuyết xác định xác suất của sự kiện $X

Tính chất của hàm phân phối thực nghiệm

Bây giờ chúng ta hãy xem xét một số tính chất cơ bản của hàm phân phối.

    Phạm vi của hàm $F_n\left(x\right)$ là đoạn $$.

    $F_n\left(x\right)$ là hàm không giảm.

    $F_n\left(x\right)$ là một hàm liên tục bên trái.

    $F_n\left(x\right)$ là hàm hằng từng phần và chỉ tăng tại các điểm có giá trị của biến ngẫu nhiên $X$

    Đặt $X_1$ là biến thể nhỏ nhất và $X_n$ là biến thể lớn nhất. Khi đó $F_n\left(x\right)=0$ cho $(x\le X)_1$ và $F_n\left(x\right)=1$ cho $x\ge X_n$.

Hãy để chúng tôi giới thiệu một định lý kết nối các hàm lý thuyết và thực nghiệm.

Định lý 1

Đặt $F_n\left(x\right)$ là hàm phân phối theo kinh nghiệm và $F\left(x\right)$ là hàm phân phối lý thuyết của mẫu tổng quát. Khi đó đẳng thức giữ:

\[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

Ví dụ về bài toán tìm hàm phân phối thực nghiệm

Ví dụ 1

Giả sử phân phối lấy mẫu có dữ liệu sau được ghi lại bằng bảng:

Hình 1.

Tìm cỡ mẫu, tạo hàm phân phối thực nghiệm và vẽ đồ thị.

Cỡ mẫu: $n=5+10+15+20=50$.

Theo thuộc tính 5, chúng ta có giá trị đó cho $x\le 1$ $F_n\left(x\right)=0$ và cho $x>4$ $F_n\left(x\right)=1$.

giá trị $x

giá trị $x

giá trị $x

Như vậy chúng ta nhận được:

Hình 2.

Hình 3.

Ví dụ 2

20 thành phố được chọn ngẫu nhiên từ các thành phố ở miền trung nước Nga, thu được dữ liệu sau về giá vé giao thông công cộng: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14 , 15, 13, 13, 12, 12, 15, 14, 14.

Tạo hàm phân phối thực nghiệm cho mẫu này và vẽ đồ thị.

Hãy viết các giá trị mẫu theo thứ tự tăng dần và tính tần số của từng giá trị. Chúng tôi nhận được bảng sau:

Hình 4.

Cỡ mẫu: $n=20$.

Theo thuộc tính 5, chúng ta có giá trị đó cho $x\le 12$ $F_n\left(x\right)=0$ và cho $x>15$ $F_n\left(x\right)=1$.

giá trị $x

giá trị $x

giá trị $x

Như vậy chúng ta nhận được:

Hình 5.

Hãy vẽ đồ thị phân bố thực nghiệm:

Hình 6.

Độc đáo: $92,12\%$.

Xác định hàm phân phối thực nghiệm

Cho $X$ là một biến ngẫu nhiên. $F(x)$ là hàm phân phối của một biến ngẫu nhiên nhất định. Chúng ta sẽ thực hiện $n$ thí nghiệm trên một biến ngẫu nhiên cho trước trong cùng điều kiện, độc lập với nhau. Trong trường hợp này, chúng ta thu được một chuỗi các giá trị $x_1,\ x_2\ $, ... ,$\ x_n$, được gọi là mẫu.

Định nghĩa 1

Mỗi giá trị $x_i$ ($i=1,2\ $, ... ,$ \ n$) được gọi là một biến thể.

Một ước tính của hàm phân phối lý thuyết là hàm phân phối thực nghiệm.

Định nghĩa 3

Hàm phân phối thực nghiệm $F_n(x)$ là hàm xác định tần suất tương đối của sự kiện $X \ cho mỗi giá trị $x$

trong đó $n_x$ là số lượng tùy chọn nhỏ hơn $x$, $n$ là kích thước mẫu.

Sự khác biệt giữa hàm thực nghiệm và hàm lý thuyết là hàm lý thuyết xác định xác suất của sự kiện $X

Tính chất của hàm phân phối thực nghiệm

Bây giờ chúng ta hãy xem xét một số tính chất cơ bản của hàm phân phối.

    Phạm vi của hàm $F_n\left(x\right)$ là đoạn $$.

    $F_n\left(x\right)$ là hàm không giảm.

    $F_n\left(x\right)$ là một hàm liên tục bên trái.

    $F_n\left(x\right)$ là hàm hằng từng phần và chỉ tăng tại các điểm có giá trị của biến ngẫu nhiên $X$

    Đặt $X_1$ là biến thể nhỏ nhất và $X_n$ là biến thể lớn nhất. Khi đó $F_n\left(x\right)=0$ cho $(x\le X)_1$ và $F_n\left(x\right)=1$ cho $x\ge X_n$.

Hãy để chúng tôi giới thiệu một định lý kết nối các hàm lý thuyết và thực nghiệm.

Định lý 1

Đặt $F_n\left(x\right)$ là hàm phân phối theo kinh nghiệm và $F\left(x\right)$ là hàm phân phối lý thuyết của mẫu tổng quát. Khi đó đẳng thức giữ:

\[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

Ví dụ về bài toán tìm hàm phân phối thực nghiệm

Ví dụ 1

Giả sử phân phối lấy mẫu có dữ liệu sau được ghi lại bằng bảng:

Hình 1.

Tìm cỡ mẫu, tạo hàm phân phối thực nghiệm và vẽ đồ thị.

Cỡ mẫu: $n=5+10+15+20=50$.

Theo thuộc tính 5, chúng ta có giá trị đó cho $x\le 1$ $F_n\left(x\right)=0$ và cho $x>4$ $F_n\left(x\right)=1$.

giá trị $x

giá trị $x

giá trị $x

Như vậy chúng ta nhận được:

Hình 2.

Hình 3.

Ví dụ 2

20 thành phố được chọn ngẫu nhiên từ các thành phố ở miền trung nước Nga, thu được dữ liệu sau về giá vé giao thông công cộng: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14 , 15, 13, 13, 12, 12, 15, 14, 14.

Tạo hàm phân phối thực nghiệm cho mẫu này và vẽ đồ thị.

Hãy viết các giá trị mẫu theo thứ tự tăng dần và tính tần số của từng giá trị. Chúng tôi nhận được bảng sau:

Hình 4.

Cỡ mẫu: $n=20$.

Theo thuộc tính 5, chúng ta có giá trị đó cho $x\le 12$ $F_n\left(x\right)=0$ và cho $x>15$ $F_n\left(x\right)=1$.

giá trị $x

giá trị $x

giá trị $x

Như vậy chúng ta nhận được:

Hình 5.

Hãy vẽ đồ thị phân bố thực nghiệm:

Hình 6.

Độc đáo: $92,12\%$.

Tìm hiểu công thức thực nghiệm là gì. Trong hóa học, EP là cách đơn giản nhất để mô tả một hợp chất—về cơ bản là danh sách các nguyên tố tạo nên hợp chất dựa trên tỷ lệ phần trăm của chúng. Cần lưu ý rằng công thức đơn giản này không mô tả đặt hàng nguyên tử trong một hợp chất, nó chỉ đơn giản cho biết nó bao gồm những nguyên tố nào. Ví dụ:

  • Một hợp chất gồm 40,92% cacbon; 4,58% hydro và 54,5% oxy sẽ có công thức thực nghiệm C 3 H 4 O 3 (ví dụ về cách tìm EF của hợp chất này sẽ được thảo luận trong phần thứ hai).
  • Hiểu thuật ngữ “thành phần phần trăm”."Thành phần phần trăm" dùng để chỉ tỷ lệ phần trăm của từng nguyên tử riêng lẻ trong toàn bộ hợp chất được đề cập. Để tìm công thức thực nghiệm của một hợp chất, bạn cần biết thành phần phần trăm của hợp chất đó. Nếu bạn đang tra cứu một công thức thực nghiệm cho bài tập về nhà thì rất có thể nó sẽ đưa ra tỷ lệ phần trăm.

    • Để tìm thành phần phần trăm của một hợp chất hóa học trong phòng thí nghiệm, người ta phải thực hiện một số thí nghiệm vật lý và sau đó phân tích định lượng. Trừ khi bạn đang ở trong phòng thí nghiệm, bạn không cần phải thực hiện những thí nghiệm này.
  • Hãy nhớ rằng bạn sẽ phải đối phó với các nguyên tử gram. Nguyên tử gram là một lượng cụ thể của một chất có khối lượng bằng khối lượng nguyên tử của nó. Để tìm nguyên tử gram, bạn cần sử dụng phương trình sau: Tỷ lệ phần trăm của một nguyên tố trong hợp chất được chia cho khối lượng nguyên tử của nguyên tố đó.

    • Ví dụ: giả sử chúng ta có một hợp chất chứa 40,92% carbon. Khối lượng nguyên tử của cacbon là 12, vì vậy phương trình của chúng ta sẽ là 40,92 / 12 = 3,41.
  • Biết cách tìm tỉ số nguyên tử. Khi làm việc với một hợp chất, bạn sẽ thu được nhiều hơn một gam nguyên tử. Sau khi tìm thấy tất cả các nguyên tử gram trong hợp chất của bạn, hãy nhìn vào chúng. Để tìm tỷ lệ nguyên tử, bạn cần chọn giá trị gam-nguyên tử nhỏ nhất mà bạn đã tính được. Sau đó, bạn sẽ cần chia tất cả các nguyên tử gram thành nguyên tử gram nhỏ nhất. Ví dụ:

    • Giả sử bạn đang làm việc với một hợp chất chứa ba nguyên tử gam: 1,5; 2 và 2,5. Số nhỏ nhất trong các số này là 1,5. Do đó, để tìm tỷ lệ của các nguyên tử, bạn phải chia tất cả các số cho 1,5 và đặt dấu tỷ lệ giữa chúng : .
    • 1,5 / 1,5 = 1. 2 / 1,5 = 1,33. 2,5 / 1,5 = 1,66. Do đó tỉ số nguyên tử là 1: 1,33: 1,66 .
  • Hiểu cách chuyển đổi các giá trị tỷ lệ nguyên tử thành số nguyên. Khi viết một công thức thực nghiệm, bạn phải sử dụng số nguyên. Điều này có nghĩa là bạn không thể sử dụng các số như 1,33. Sau khi tìm được tỷ lệ của các nguyên tử, bạn cần chuyển phân số (như 1,33) thành số nguyên (như 3). Để làm điều này, bạn cần tìm một số nguyên, nhân từng số của tỷ lệ nguyên tử với đó bạn sẽ nhận được số nguyên. Ví dụ:

    • Hãy thử 2. Nhân các số có tỷ số nguyên tử (1, 1,33 và 1,66) với 2. Bạn nhận được 2, 2,66 và 3,32. Đây không phải là số nguyên nên 2 không phù hợp.
    • Hãy thử 3. Nếu bạn nhân 1, 1,33 và 1,66 với 3, bạn sẽ nhận được 3, 4 và 5 tương ứng. Do đó tỉ số nguyên tử của các số nguyên có dạng 3: 4: 5 .
  • Bài giảng 13. Khái niệm ước lượng thống kê các biến ngẫu nhiên

    Giả sử phân bố tần số thống kê của một đặc tính định lượng X được biểu thị bằng số lượng quan sát trong đó giá trị của đặc tính được quan sát nhỏ hơn x và n là tổng số quan sát. Rõ ràng, tần suất tương đối của sự kiện X< x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

    Hàm phân phối theo kinh nghiệm(hàm phân phối lấy mẫu) là hàm xác định cho mỗi giá trị x tần suất tương đối của sự kiện X< x. Таким образом, по определению ,где - число вариант, меньших x, n – объем выборки.

    Ngược lại với hàm phân bố thực nghiệm của một mẫu, hàm phân bố tổng thể được gọi là hàm phân phối lý thuyết. Sự khác biệt giữa các hàm này là hàm lý thuyết xác định xác suất sự kiện X< x, тогда как эмпирическая – tần số tương đối cùng một sự kiện.

    Khi n tăng, tần suất tương đối của sự kiện X< x, т.е. стремится по вероятности к вероятности этого события. Иными словами

    Tính chất của hàm phân phối thực nghiệm:

    1) Các giá trị của hàm thực nghiệm thuộc đoạn

    2) - hàm không giảm

    3) Nếu là tùy chọn nhỏ nhất thì = 0 cho , nếu là tùy chọn lớn nhất thì = 1 cho .

    Hàm phân phối thực nghiệm của mẫu dùng để ước tính hàm phân phối lý thuyết của tổng thể.

    Ví dụ. Hãy xây dựng một hàm thực nghiệm dựa trên phân phối mẫu:

    Tùy chọn
    Tần số

    Hãy tìm cỡ mẫu: 12+18+30=60. Tùy chọn nhỏ nhất là 2, nên =0 với x £ 2. Giá trị của x<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x £6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x £10. Так как x=10 – наибольшая варианта, то =1 при x>10. Như vậy, hàm thực nghiệm mong muốn có dạng:

    Các tính chất quan trọng nhất của ước tính thống kê

    Cần phải nghiên cứu một số đặc điểm định lượng của dân số nói chung. Chúng ta hãy giả sử rằng từ những cân nhắc về mặt lý thuyết, có thể thiết lập rằng cái nào chính xác phân phối có dấu và cần phải đánh giá các tham số mà nó được xác định. Ví dụ, nếu đặc tính đang được nghiên cứu có phân bố chuẩn trong tổng thể thì cần phải ước lượng kỳ vọng toán học và độ lệch chuẩn; nếu đặc tính có phân phối Poisson thì cần ước tính tham số l.

    Thông thường, chỉ có sẵn dữ liệu mẫu, ví dụ: các giá trị của đặc tính định lượng thu được từ kết quả của n quan sát độc lập. Xem xét như các biến ngẫu nhiên độc lập, chúng ta có thể nói rằng để tìm ước tính thống kê của một tham số chưa biết của phân bố lý thuyết có nghĩa là tìm hàm của các biến ngẫu nhiên được quan sát cho giá trị gần đúng của tham số ước tính. Ví dụ: để ước tính kỳ vọng toán học của phân phối chuẩn, vai trò của hàm được thực hiện bởi trung bình số học



    Để các ước tính thống kê đưa ra các xấp xỉ chính xác của các tham số ước tính, chúng phải đáp ứng một số yêu cầu nhất định, trong đó quan trọng nhất là các yêu cầu không bị dịch chuyển khả năng thanh toán đánh giá.

    Giả sử là ước tính thống kê của tham số chưa biết của phân bố lý thuyết. Giả sử ước tính được tìm thấy từ một mẫu có kích thước n. Hãy lặp lại thí nghiệm, tức là. Hãy trích xuất một mẫu khác có cùng kích thước từ tổng thể chung và dựa trên dữ liệu của nó để có được ước tính khác. Lặp lại thí nghiệm nhiều lần, ta được các số khác nhau. Điểm số có thể được coi là một biến ngẫu nhiên và các con số là giá trị có thể có của nó.

    Nếu ước tính đưa ra một giá trị gần đúng dồi dào, tức là mỗi số lớn hơn giá trị thực và do đó, kỳ vọng toán học (giá trị trung bình) của biến ngẫu nhiên lớn hơn:. Tương tự như vậy, nếu nó đưa ra một ước tính với một bất lợi, Cái đó .

    Do đó, việc sử dụng ước tính thống kê, kỳ vọng toán học của nó không bằng tham số ước tính, sẽ dẫn đến sai số hệ thống (cùng dấu). Ngược lại, nếu điều này đảm bảo chống lại các lỗi hệ thống.

    không thiên vị được gọi là ước tính thống kê, kỳ vọng toán học của nó bằng tham số ước tính cho bất kỳ cỡ mẫu nào.

    Đã di dờiđược gọi là ước lượng không thỏa mãn điều kiện này.

    Tính không thiên vị của ước tính vẫn chưa đảm bảo tính gần đúng tốt cho tham số ước tính, vì các giá trị có thể có có thể là rất rải rác xung quanh giá trị trung bình của nó, tức là sự khác biệt có thể là đáng kể. Trong trường hợp này, chẳng hạn, ước tính được tìm thấy từ dữ liệu của một mẫu có thể khác xa đáng kể so với giá trị trung bình và do đó khác với tham số được ước tính.

    Hiệu quả là ước tính thống kê, với cỡ mẫu n cho trước, có phương sai nhỏ nhất có thể .

    Khi xem xét các mẫu lớn, cần phải ước tính thống kê để khả năng thanh toán .

    Giàu có được gọi là ước tính thống kê, vì n®¥ có xu hướng xác suất đối với tham số ước tính. Ví dụ: nếu phương sai của ước tính không thiên lệch có xu hướng bằng 0 ở dạng n®¥, thì ước tính đó hóa ra là nhất quán.