Phân phối xác suất

Thứ Bảy, 27/05/2023

Tram Ho

Sự định nghĩa:

Phân phối xác suất được định nghĩa là một loạt các giá trị mà các biến ngẫu nhiên sử dụng để quyết định khả năng xảy ra sự kiện. Những sự kiện này, chẳng hạn như tung xúc xắc hoặc xác suất rút được quân vua từ một bộ bài được tính toán và chỉ định trên tất cả các kết quả có thể xảy ra. Tuy nhiên, nó bắt đầu chứng minh tầm quan trọng khi Phân phối xác suất giúp tìm ra hàm phân phối xác suất, hàm này được sử dụng trong các mô hình thống kê như kiểm tra giả thuyết. Trước khi tìm hiểu sâu về nó, chúng ta hãy xem một số ví dụ phổ biến, cách sử dụng và các loại phân phối xác suất.

Các loại và tính chất của phân phối xác suất:

Trong Thống kê, phân phối xác suất được thực hiện với việc sử dụng đồ thị trên trục X và trục Y. Trên thang X, chúng tôi gắn nhãn các biến ngẫu nhiên trong khi chúng tôi có thể cho biết về điểm số xác suất phân phối từ trục Y. Đối với biểu thức chung của phân phối xác suất trong thống kê, chúng tôi sử dụng X ~ N (µ, σ) trong đó trung bình tổng thể và độ lệch chuẩn được biểu thị bên trong dấu ngoặc. Bây giờ phân phối ở đây được gọi là N, thường là biểu thức cho Phân phối chuẩn, tuy nhiên, chúng ta có thể có các ký hiệu được biểu thị trên trục Y cho nhiều loại phân phối xác suất. Chủ yếu, có hai loại Phân phối xác suất – Phân phối xác suất rời rạc và Phân phối xác suất liên tục.

Phân phối xác suất rời rạc:

Phân phối xác suất rời rạc biểu thị phân phối xác suất cho các biến rời rạc. Biến rời rạc là biến nhận một giá trị không thể có bất kỳ giá trị nào khác ở giữa. Ví dụ, tung đồng xu là một biến ngẫu nhiên rời rạc vì với mỗi lần tung đồng xu, kết quả chỉ có thể là mặt ngửa hoặc mặt sấp. Ở đây, chúng ta có thể sắp xếp các giá trị rời rạc của dữ liệu trong một bảng. Tuy nhiên, một điều cần lưu ý là xác suất của tất cả các biến ngẫu nhiên kết hợp sẽ luôn bằng một, vì chỉ khi đó chúng ta mới có thể đưa một số quan sát hữu hạn vào kiểm tra.

Các loại phân phối xác suất rời rạc:

Ngay cả trong các phân phối xác suất rời rạc, chúng ta có nhiều ký hiệu khác nhau như phân phối Nhị thức, Bernoulli, Poisson hoặc Thống nhất. Tất cả những điều này được đặc trưng bởi các hình dạng khác nhau mà chúng có tùy thuộc vào thời gian và sự xuất hiện của các biến. Ví dụ: sự khác biệt giữa phân phối Nhị thức và Bernoulli là số lượng mẫu được đánh giá trong quá trình xảy ra. Trong khi Bernoulli sẽ tính toán xác suất của một sự kiện đơn lẻ, phân phối Nhị thức tính toán khả năng xảy ra của một kết quả trong một loạt các sự kiện liên tiếp. Đồng thời, phân phối xác suất của Poisson tập trung vào việc trả về xác suất của kết quả tại một khoảng thời gian nhất định. Mặt khác, thống nhất mô tả sự phân bố của các biến trải đều từ giá trị trung bình ở cả hai phía của biểu đồ.

Phân phối xác suất liên tục:

Chúng ta đã thấy trước đó rằng các biến rời rạc nhận các giá trị không thể nhận bất kỳ giá trị nào khác ở giữa. Một cách tương đối, các biến Liên tục là những biến có thể nhận bất kỳ số lượng giá trị nào ở giữa vì đây thường là các thực thể có giới hạn thời gian. Ví dụ: lấy dữ liệu về thời tiết, chiều cao hoặc cân nặng của một người. Dữ liệu này có thể thay đổi đối với bất kỳ độ nhạy thời gian nào có liên quan và cũng có một phạm vi giá trị cần thực hiện trong phạm vi đó. Điều này làm cho Phân phối xác suất liên tục có hình dạng cho chúng ta biết về các tham số mà nó đúng đối với thống kê – chẳng hạn như độ lệch chuẩn hoặc thước đo độ phân tán.

Các loại phân phối xác suất liên tục:

Cũng giống như phân bố xác suất rời rạc, phân bố xác suất liên tục có thể được vẽ theo nhiều cách khác nhau. Tùy thuộc vào các tham số đã chọn, chúng ta có thể nhận được phân phối chuẩn thường được gọi là phân phối Gaussian hoặc thậm chí là “đường cong hình chuông”. Ngoài phân phối chuẩn, đồ thị dữ liệu bị lệch thường được quan sát thấy trong các phân phối xác suất liên tục trong đó các đường cong có thể lệch trái hoặc lệch phải. Một loại phân phối kéo theo phân phối lệch phải là phân phối logic và loại kia là phân phối gamma. Các bản phân phối khác có thể được đề cập dưới biểu ngữ phân phối liên tục là Đồng nhất, Theo cấp số nhân và Beta.

Sử dụng phân phối xác suất: Kiểm tra giả thuyết

Bây giờ chúng ta đã đề cập đến các loại phân phối khác nhau và cách chúng cho chúng ta biết về các tham số khác nhau, chúng ta có thể xem xét kỹ cách nó được sử dụng trong các ứng dụng thống kê thực tế. Thử nghiệm giả thuyết, tạo thành trụ cột của suy luận từ các quan sát trong thống kê, sử dụng các phân phối xác suất để tính toán các giá trị p. Một lần nữa, các loại thử nghiệm khác nhau được thực hiện trong thử nghiệm giả thuyết mang lại các giá trị khác nhau, thử nghiệm t sử dụng giá trị t, ANOVA sử dụng giá trị f và thử nghiệm chi bình phương sử dụng giá trị chi bình phương.

Phần kết luận:

Xác suất là một phần quan trọng của phân tích thống kê cho phép tạo ra thông tin chi tiết, dự báo và lập mô hình thống kê theo thời gian thực bằng cách sử dụng các thư viện để đưa ra kết quả phù hợp.

Chia sẻ bài viết ngay

Nguồn bài viết : Viblo

Phân phối xác suất

TikTok trở thành nền tảng mảng xã hội lớn thứ hai ở Nam Phi

Mất giá nhanh nhất sau 9 tháng ra mắt, iPhone 14 Pro Max tiếp tục phá đáy tại Việt Nam

Hướng dẫn sử dụng ngôn ngữ R cho người mới bắt đầu

10 plugin cần thiết của SublimeText dành cho các lập trình viên JavaScript