Tương quan Pearson-Stata
Hệ số xác định bình phương R trong hồi quy tuyến tính đơn giản là công cụ ước tính hệ số tương quan của Người. Nội dung bài viết này trình bày về hệ số tương quan Pearson.
Tương quan thể hiện mối quan hệ tương đối giữa hai biến. Hệ số tương quan sẽ cho biết độ mạnh hoặc mức độ của mối quan hệ giữa hai biến.
Có hai cách để xác định mối tương quan:
Xem thêm: Ý nghĩa và cách tính hệ số tương quan Pearson
Ví dụ: chúng tôi muốn biết doanh số bán hàng trong một năm liên quan như thế nào đến các năm trước và các năm tiếp theo. Dữ liệu về doanh thu hàng năm của 25 cửa hàng được tổng hợp thành một tệp dữ liệu tiện dụng có tên là sử dụng rõ ràng
su DT2011 DT2012 DT2013
Giá trị thu nhập bình quân của 24 cửa hàng trong 3 năm 2011, 2012, 2013 như sau: 893,96; 832.12; 537.63
Trước khi xác định hệ số tương quan Pearson, chúng ta cần kiểm tra dạng phân phối của các biến liên tục.
Xem thêm: Kiểm tra phân phối chuẩn của biến.
Trong ví dụ này, các biến DT2011, DT2012 và DT2013 không có phân phối chuẩn. Tuy nhiên, để minh họa cách thực hiện phép tính hệ số tương quan Pearson trong Stata, chúng ta coi biến DT2011 và DT2012 có phân phối chuẩn.
Sau đó, hệ số tương quan Pearson được tính toán trong Stata bằng lệnh corr như sau:
thu hoạch DT2011 DT2012
Kết quả cho thấy, với hệ số tương quan là 0,8706 thể hiện mối tương quan thuận chặt chẽ giữa hai biến DT2011 và DT2012. Tuy nhiên, với nhận định thô thiển này, chúng ta không thể biết mối tương quan này có ý nghĩa thống kê hay không.
Để biết ý nghĩa thống kê của các hệ số tương quan Pearson, chúng ta có thể sử dụng lệnh pwcorr với tùy chọn star(0.05). Kết quả ở hình trên cho thấy mối tương quan giữa hai biến DT2011 và DT2012 là có ý nghĩa thống kê ở mức 5%.
Xem thêm: Tương quan hạng của Spearman