Rss Feed
Xây dựng phong cách người CAND bản lĩnh
Tuyên truyền phổ biến, giáo dục pháp luật
Bông Hồng Xanh
tap chi

Thống kê

  • Đang truy cập: 40
  • Khách viếng thăm: 39
  • Máy chủ tìm kiếm: 1
  • Hôm nay: 1930
  • Tháng hiện tại: 128094
  • Tổng lượt truy cập: 2654467

Phân phối chuẩn trong thống kê và ý nghĩa trong thực tế, giáo dục

Đăng lúc: Chủ nhật - 14/01/2018 08:52 - Người đăng bài viết: Tạp Chí
        Khái niệm phân phối chuẩn được nhà toán học Abraham de Moivre (1667-1754) lần đầu tiên giới thiệu trong một bài báo năm 1734. Khái niệm này sau đó được Gauss (1777-1855) mở rộng và xây dựng trên cơ sở lý thuyết và thực nghiệm. Cuối cùng được Laplace (1749-1827) hoàn thiện trong cuốn sách Analytical Theory of Probabilities, xuất bản vào năm 1812.[1]
       Phân phối xác suất dùng để miêu tả mức độ (hay xác suất) xảy ra các khả năng có thể một đại lượng ngẫu nhiên, nhằm giúp người nghiên cứu dễ dàng nhận biết các khả năng nào hay xảy ra nhất và với giá trị là bao nhiêu. Ví dụ nhiệt độ trong các ngày tại thành phố Hồ Chí Minh là một đại lượng ngẫu nhiên, nhưng sẽ nhận các giá trị nằm trong giới hạn nào đó, giả sử từ 200 đến 390, trong đó phần lớn  là các giá trị từ 300, 310 , 320 hoặc 330. Nhiệt độ 200 sẽ chỉ xuất hiện hiếm hoi trong một vài ngày. Khi đó ta nói, xác suất xuất hiện của nhiệt độ 200 là rất thấp.
 
       Phân phối chuẩn là một trong các phân phối xác suất quan trọng nhất của toán thống kê, phản ánh giá trị và mức độ phân bố của các dữ liệu đang nghiên cứu. Thế giới tự nhiên, cũng như nhiều các quy luật kinh tế xã hội tuân theo luật phân phối chuẩn này, điển hình như: Chỉ số thông minh IQ, chiều cao, cân nặng, chiều dài giấc ngủ của con người, sự biến động giá trị cổ phiếu trên thị trường chứng khoán, hay mức thu nhập người lao động…
 
 
       Phân phối chuẩn được đặc trưng bởi hai tham số là giá trị kỳ vọng µ (Muy) còn được hiểu là giá trị trung bình, và độ lệch tiêu chuẩn σ (Sigma). Trong khi giá trị µ là mức trung bình của tất cả các dữ liệu đang nghiên cứu thì σ phản ánh mức độ đồng đều của các dữ liệu này. Đồ thị của phân phối chuẩn có dạng hình chuông (Hình 1), nên đôi khi người ta còn gọi nó là phân phối hình chuông hay đường cong hình chuông – Bell Curve, và được biểu diễn bởi hàm mật độ xác suất:

 

       Chỉ số IQ - dùng để đánh giá mức độ thông minh của con người, tuân theo luật phân phối chuẩn (Hình 2). Phân phối này có giá trị kỳ vọng là µ=100, σ = 15, hay hiểu nôm na ra thì chỉ số IQ trung bình của dân số thế giới là 100, độ lệch tiêu chuẩn là 15.
       Theo tính chất của phân phối chuẩn thì % diện tích các hình giới hạn bởi đường cong Bell Curve như sau:
 
 
       Như vậy, sẽ có 68.2% dân số thế giới có mức IQ từ 85 tới 115 (từ 100-15 tới 100+15) tức là trong khoảng (µ-σ, µ+σ). Khoảng này cũng được coi là khoảng mặt bằng chung của tập hợp, hay khoảng đa số. Nói cách khác, nếu gặp ngẫu nhiên 100 người trên hành tinh này, thường thì bạn sẽ gặp được khoảng 68 người có mức IQ “bình thường”.
       Vậy cơ hội để chúng ta gặp được “thiên tài” có mức IQ lớn hơn 160 như nhà bác học Albert Einstein hay Stephen Hawking là bao nhiêu? Rõ ràng với mức IQ 160 sẽ nằm ở µ + 4σ và cơ hội của chúng ta chỉ là (1-99.99%)/2 = 0.005%.
       Phân phối chuẩn nếu nhìn từ góc độ kiểm định giả thiết sẽ cho ta một mức sự tin cậy nhất định nào đó trước khi ta đi tới kết luận. Trong một mô hình nghiên cứu về một sự vật, hiện tượng nào đó bằng cách thu thập nhiều các số liệu về chúng, nếu xuất hiện một điểm số liệu cách mô hình được kiểm tra một vài độ lệch chuẩn, thì đây là bằng chứng mạnh mẽ cho thấy điểm số liệu đó không khớp với mô hình đó. Như vậy độ lệch chuẩn sigma σ được sử như một thước đo. Tuy nhiên, làm thế nào sử dụng thước đo này thì tùy thuộc vào tình huống cụ thể. Giáo sư John Tsitsiklis tại MIT, người giảng dạy Cơ sở Xác suất, phát biểu, “Thống kê là một nghệ thuật, với rất nhiều chỗ cho sự sáng tạo và sai lầm”. Một phần của nghệ thuật đó là xác định xem những số đo nào là có nghĩa trong một tình huống đã cho.[2]
 
        Ví dụ, trong xét nghiệm ADN để xác định huyết thống cha con, người ta thường lấy mức 4σ, tức trùng khớp 99,99% sẽ được kết luận là có huyết thống cha con. Nhưng mức này lại chưa đủ cho kết luận về những giả thiết đang thách thức kiến thức của các nhà khoa học về một hiện tượng quan trọng – Như việc phát hiện ra hạt hạ nguyên tử Higgs[3], người ta phải làm các thí nghiệm thực nghiệm có độ tin cậy 5σ tương ứng với sai số là ba phần mười triệu (độ tin cậy 99.9999%), đây cũng là mức mà các nhà vật lý hạt cơ bản sử dụng để công nhận một phát hiện mới.
        Ở góc độ ứng dụng giản đơn, chúng ta hoàn toàn có thể áp dụng mô hình phân phối chuẩn trong việc kiểm tra, đánh giá và phân loại học sinh trong trường học.
        Để phản ánh được trung thực trình độ nhận thức của học sinh, sinh viên, cũng như mức độ vừa sức của bài kiểm tra đánh giá kết quả học tập, kết quả thi kiểm tra nên có phân phối số điểm theo hình dạng đường cong chuẩn này.
        Theo đó, sẽ có khoảng 68,2% học sinh đạt mức điểm trung bình, mức 1σ. Mức 2σ, 3σ bên phải là các học sinh khá, giỏi chiếm tỉ lệ tương ứng là 13.6% và 2.1%, và tương tự đối với học sinh yếu, kém. Và như vậy, chúng ta trả lại ý nghĩa ban đầu cho các cụm từ “trung bình”, “khá”, “giỏi”. Một học sinh có học lực “trung bình” thực ra nằm ở khoảng mặt bằng chung của lớp (µ-σ, µ+σ), không cần phải quá tự ti về mức học lực này. Nhưng một học sinh có học lực “giỏi” trong khi tỉ lệ giỏi của lớp chiếm tới hơn  90%, thì cũng không mang nhiều ý nghĩa. Thực tế, chúng ta hoàn toàn có thể chọn các giá trị khác nhau của µ và σ tùy theo hoàn cảnh, ví dụ chọn mức trung bình µ=7 điểm, σ=1 điểm để khuyến khích động viên tinh thần học tập của học sinh, tuy nhiên chọn µ quá cao sẽ dẫn tới bệnh thành tích trong giáo dục, vốn là con dao hai lưỡi, đôi khi dẫn mang lại hiệu quả trái ngược.
        Toán học hiện đại không ngừng phát triển, nhưng các kiến thức về toán học dù cổ điển được tìm ra cách đây hàng thế kỷ nó cũng không bao giờ trở thành sai hay lỗi thời. Hiểu được bản chất vấn đề, nắm được quy luật tự nhiên, có một nền tảng kiến thức cơ bản tốt, sẽ là tiền đề để phát triển thành con người làm chủ tri thức, đóng góp tích cực cho sự phát triển chung của nhân loại.

 

[1] https://en.wikipedia.org/wiki/Normal_distribution#History
[2] http://360.thuvienvatly.com/bai-viet/vat-ly-thong-ke/2228-sigma-bao-nhieu-thi-dang-tin-cay
[3] https://en.wikipedia.org/wiki/Higgs_boson

Tác giả bài viết: Nguyễn Văn Xuân - Trường Đại học CSND
Đánh giá bài viết
Tổng số điểm của bài viết là: 5 trong 1 đánh giá
Click để đánh giá bài viết

Ý kiến bạn đọc

 

Văn bản mới

Số: 13/2017/QH14
Tên: (Luật Cảnh vệ)

Ngày BH: (20/06/2017)

Số: Chỉ thị số 13-CT/TW
Tên: (Về tăng cường sự lãnh đạo của đảng đối với công tác quản lý, bảo vệ và phát triển rừng)

Ngày BH: (12/01/2017)

Số: Thông tư 49/2017/TT-BCA
Tên: (Quy định chi tiết chế độ bồi dưỡng giám định tư pháp trong lĩnh vực kỹ thuật hình sự; thành phần, số người thực hiện nhiệm vụ khi giám định đối với trường hợp khám nghiệm tử thi, mổ tử thi và khai quật tử thi)

Ngày BH: (26/10/2017)

Số: Chỉ thị số 14-CT/TW
Tên: (Tăng cường sự lãnh đạo của Đảng đối với công tác người có công với cách mạng)

Ngày BH: (19/07/2017)

Số: 1884/QyĐ-T48
Tên: (Quy định về văn hóa ứng xử của cán bộ, giảng viên, công nhân viên và sinh viên Trường Đại học CSND)

Ngày BH: (13/10/2017)

Số: 27/2017/TT-BCA
Tên: (Quy định về quy tắc ứng xử của Công an nhân dân)

Ngày BH: (22/08/2017)

Số: 124/2015/NĐ-CP
Tên: (NGHỊ ĐỊNH SỐ 185/2013/NĐ-CP NGÀY 15 THÁNG 11 NĂM 2013)

Ngày BH: (15/11/2013)

Số: Chứng chỉ Tin học ICDL
Tên: (ICDL là chứng chỉ kỹ năng sử dụng công nghệ thông tin)

Ngày BH: (13/11/2015)

Số: 2785/BYT-KCB
Tên: (Tăng cường thực thi Luật Phòng, chống tác hại thuốc lá và hưởng ứng Ngày thế giới không thuốc lá; Tuần lễ Quốc gia không thuốc lá năm 2016)

Ngày BH: (16/05/2016)

Số: VBQPPL
Tên: (Hệ thống văn bản về thuế 2)

Ngày BH: (10/05/2017)