Home Page TOOLS Probability & Statistic KIỂM ĐỊNH PHÂN BỐ
KIỂM ĐỊNH PHÂN BỐ

KIỂM ĐỊNH PHÂN BỐ

Nguyễn Như Phong

Kỹ thuật Hệ thống Công nghiệp

Đại học Bách Khoa, ĐHQG TPHCM

 

 

 

1.1. Kiểm định phân bố

Các bước nhằm xác định phân bố lý thuyết của một tập số liệu mẫu:

  1. Giả thuyết phân bố phù hợp.
  2. Ước lượng tham số phân bố.
  3. Kiểm định phân bố.

Giả thuyết phân bố phù hợp là bước trực quan dựa vào các trị thống kê của tập số liệu như trung bình mẫu, trung vị mẫu, yếu vị mẫu, phương sai mẫu, các điểm tứ phân vị, điểm cực… hay dựa vào dạng biểu đồ hộp, tần đồ, … chọn phân bố lý thuyết phù hợp cho tập số liệu mà chưa để ý đến tham số phân bố. Có thể có nhiều phân bố phù hợp với một tập số liệu.

Sau khi đã chọn được phân bố phù hợp, bước ước lượng tham số phân bố sẽ ước lượng tham số phân bố đã chọn. Có nhiều kỹ thuật ước lượng như phương pháp cực tiểu tổng bình phương LSE, phương pháp ước lượng không lệch, phương pháp ước lượng MLE… Trong đó phương pháp ước lượng MLE là thường dùng vì có nhiều ưu điểm.

Sau khi đã chọn được phân bố lý thuyết phù hợp, ước lượng được tham số phân bố, Kiểm định phân bố kiểm định mức độ phù hợp của phân bố lý thuyết đã chọn với các tham số đã ước lượng với phân bố tiềm ẩn của tập số liệu mẫu. Phương pháp kiểm định phân bố kinh điển thường dùng là phân chia tập dữ liệu mẫu thành một số hữu hạn các vùng số liệu, sau đó đếm số số liệu mẫu trong mỗi vùng và so sánh với giá trị tương ứng của một phân bố lý thuyết đã chọn nhằm đánh giá phân bố đã chọn có phù hợp hay không. Các phương pháp kiểm định phân bố bao gồm:

  • Phương pháp trực quan
  • Phương pháp kiểm tra mức phù hợp GOF

a. Phương pháp trực quan

Phương pháp trực quan so sánh phân bố dựa vào trực quan và kinh nghiệm, bao gồm hai phương pháp:

  • Phương pháp so sánh hình dạng phân bố
  • Phương pháp đồ thị xác suất

Phương pháp so sánh hình dạng phân bố so sánh trực quan giữa phân bố trọng lượng thực nghiệm pn của tập dữ liệu với hàm mật độ f hay hàm trọng lượng p của phân bố lý thuyết hay giữa phân bố tích lũy thực nghiệm Fn của tập số liệu với hàm tích lũy F của phân bố lý thuyết. Phương pháp đồ thị xác suất là phương pháp trực quan so sánh phân bố dựa vào đồ thị xác suất. Đồ thị xác suất là đồ thị của chênh lệch giữa phân bố tích lũy lý thuyết F và phân bố tích lũy thực nghiệm Fn.

                   D(x) = F(x) – Fn(x)

b. Phương pháp kiểm tra mức phù hợp GOF

Phương pháp kiểm tra mức phù hợp GOF là phương pháp kiểm định giả thuyết thống kê:

          H0: Xi: i=1¸n là các biến ngẫu nhiên độc lập, đồng dạng phân bố F.

Các phương pháp kiểm tra mức phù hợp GOF bao gồm:

  • Kiểm định Chi-Square
  • Kiểm định Kolmogorov-Smirnov
  • Kiểm định Anderson-Darling

Kiểm định Chi-Square dựa vào phân bố Chi-Square so sánh phân bố trọng lượng thực nghiệm của tập dữ liệu với hàm mật độ f hay hàm trọng lượng p của phân bố lý thuyết. Kiểm định Kolmogorov-Smirnov so sánh phân bố tích lũy thực nghiệm của tập dữ liệu với hàm tích lũy F của phân bố lý thuyết. Kiểm định Anderson-Darling là một phương pháp cải tiến của Kiểm định Kolmogorov-Smirnov.

 

1.2.  Kiểm định phân bố chuẩn

Một phân bố thường được chọn trong kỹ thuật công nghiệpphân bố chuẩn. Một giả định thường gặp trong kỹ thuật công nghiệp là giả sử một tập số liệu mẫu rút từ một phân bố chuẩn. Một công cụ kiểm tra giả định này là chuẩn đồ, là một công cụ theo phương pháp trực quan là phương pháp đồ thị xác suất nêu trên.

Chuẩn đồ là công cụ kiểm tra giả định một tập số liệu mẫu rút ra từ một phân bố chuẩn. Xem tập số liệu:

                   X1, …, Xn

Nhằm xây dựng chuẩn đồ, ta sắp xếp tập số liệu này theo thứ tự từ nhỏ đến lớn:

                   X(1), …, X(n)

Phân bố tích lũy thực nghiệm:

                   Fn(X(i)) = (i-0,5)/n, i=1¸n

Chuẩn đồ là biểu đồ với các điểm có tọa độ:

                   [X(j), Fn(X(i))]

Nếu tập số liệu có phân bố chuẩn thì các điểm trên chuẩn đồ như nằm trên một đường thẳng. Việc vẽ đường thẳng là chủ quan, nên chú ý đến các điểm giữa hơn là các điểm biên, đặc biệt là các điểm giữa các điểm bách phân vị P25 và P75.

Ví dụ:

Dữ liệu sai số của 1 thực nghiệm thu thập được như ở bảng sau.

-2,8

-2,8

5,2

1,2

-0,8

-3,6

1,4

-3,6

2,4

3,4

-3,6

0,4

0,4

1,4

1,4

-2,6

3,4

0,4

-2,6

1,4

-3,8

-0,8

0,2

4,2

0,2

 

Từ số liệu của sai số thực nghiệm ở bảng trên, chuẩn đồ sai số vẽ được như ở hình sau. Ta thấy giả định sai số thực nghiệm có phân bố chuẩn là phù hợp.

Hình  Chuẩn đồ sai số thực nghiệm

 

TLTK:

Nguyễn Như Phong. Thống kê trong CN. NXBĐHQG. 2013. ISBN: 978-604-73-1998-5.

 

 

 
  • thiet ke noi that chung cu

  • thiet ke noi that chung cu

  • thiet ke noi that chung cu

  • thiet ke noi that chung cu

ABOUT US

ADMIN


GOOD BROWSERS

 
   

STATISTIC

mod_vvisit_countermod_vvisit_countermod_vvisit_countermod_vvisit_countermod_vvisit_countermod_vvisit_countermod_vvisit_counter
mod_vvisit_counterH�m nay34
mod_vvisit_counterH�m qua132
mod_vvisit_counterTu?n n�y444
mod_vvisit_counterTh�ng n�y646
mod_vvisit_counterT?t c?742264
Hiện có 19 khách Trực tuyến