Tự tương quan là gì (Autocorrelation)? Khái niệm và cách kiểm định trong Stata

Mục lục nội dung

Tự tương quan là gì? | Autocorrelation là gì? Tự tương quan hay còn gọi là Autocorrelation là hiện tượng mà tại đó hạng nhiễu tại thời điểm t (hay còn gọi là sai số) thường được kí hiệu là ut có tương quan với hạng nhiễu tại thời điểm (t-1) hoặc bất kỳ hạng nhiều nào trong quá khứ.

1. Tự tương quan là gì ? | Định nghĩa và Nguyên nhân Open

t có tương quan với hạng nhiễu tại thời điểm (t-1) hoặc bất kỳ hạng nhiều nào trong quá khứ. Thường xảy ra trong dữ liệu bảng (panel data) và trong dữ liệu chuỗi thời gian (time-series).MOSLHiện tượng tự tương quan trong kinh tế tài chính lượng hay còn gọi là Autocorrelation là hiện tượng kỳ lạ mà tại đó hạng nhiễu tại thời gian t ( hay còn gọi là sai số ) thường được kí hiệu là ucó tương quan với hạng nhiễu tại thời gian ( t-1 ) hoặc bất kể hạng nhiều nào trong quá khứ. Thường xảy ra trong tài liệu bảng ( panel data ) và trong tài liệu chuỗi thời hạn ( time-series ) .https://en.wikipedia.org/wiki/AutocorrelationTự tương quan, đôi lúc được gọi là tương quan tiếp nối đuôi nhau trong trường hợp thời hạn rời rạc, là tương quan của tín hiệu với một bản sao bị trễ của chính nó như một hàm của độ trễ .

Trong dữ liệu chuỗi thời gian (time-series) tự tương quan được gọi là Autocorrelation và trong dữ liệu bảng (panel-data) tự tương quan được gọi là Serial Correlation. Công thức chung như sau:

Uit = β*Uit-1 + cit

(U là hạng nhiễu tại t và t-1, Hệ số β ≠ 0 thì có TTQ và ngược lại)

( i = 0 khi là time-series )
Hiện tượng này vi phạm giả thuyết trong quy mô hồi quy tuyến tính cổ xưa giả định rằng quan hệ tự tương quan không sống sót trong những nhiễu ui .
Hiện tượng tự tương quan và tương quan chuỗi là giống nhau tuy nhiên vẫn có 1 số tác giả định nghĩa hai cụm từ này khác nhau, trong bài viết này MOSL xem xét chúng là như nhau .
hiện tượng tự tương quan

Mở rộng khái niệm tương quan đến tự tương quan

  • Tự tương quan được biểu diễn thành hàm tự tương quan tại đơn vị gốc và thường được sử dụng trong quy trình tự hồi quymô hình trung bình động (MA).
  • Phân tích tự tương quan được sử dụng nhiều trong quang phổ tương quan huỳnh quang để cung cấp cái nhìn định lượng về sự khuếch tán ở cấp độ phân tử và các phản ứng hóa học.
  • Tự tương qua tín hiệu để xác định tín hiệu thời gian liên tục.
  • Ma trận tự tương quan là ma trận Hermitian cho các vectơ ngẫu nhiên phức tạp và một ma trận đối xứng cho các vectơ ngẫu nhiên thực.
  • Công thức kinh tế lượng của tự tương quan được xây dựng trên hệ số hiệp phương sai chéo.

Xem thêm: Hồi quy Ma trận tương quan trong Stata

2. Hậu quả do hiện tượng kỳ lạ tự tương quan gây ra là gì ?

Các ước lượng mô hình OLS vẫn không chệch và nhất quán theo phân phối chuẩn cho dù có hiện tượng này xảy ra.

  • Các ước lượng nói trên không còn hiệu quả nữa nghĩa là chúng không còn là ước lượng tuyến tính không chệch tốt nhất nữa (còn gọi là BLUE).
  • Các giá trị sai số chuẩn của mô hình OLS bị ước lượng thấp (underestimated), tức các giá trị t ước lượng bị thổi phồng cao hơn mức bình thường.
  • Các kiểm định giả thuyết trở nên đáng nghi vì các sai số ước lượng không còn đáng tin cậy. Do đó, kiểm định tF có thể sẽ không còn hiệu lực.
  • Các trường hợp khác có thể dẫn đến mô hình bị hiện tượng hồi quy giả mạo (spurios regression)

3. Nhận biết và kiểm tra tự tương quan bằng Stata

Mặc dù có nhiều kiểm định tự tương quan, nhưng ở đây MOSL sẽ chỉ thảo luận một vài cách, cụ thể là phương pháp đồ thị (graphical method), kiểm định Durbin-Watson, và kiểm định Breusch-Godfrey.

3.1. Phương pháp vẽ đồ thị

Khi nhìn nhận những hiệu quả hồi quy thì một cách thực hành thực tế tốt là luôn luôn phải vẽ đồ thị phần dư từ quy mô .

Vì tự tương quan là sự tương quan giữa các hạng nhiễu ut, nên một phương pháp đơn giản tình thế để kiểm định tự tương quan đơn giản là vẽ các giá trị của ut theo thời gian.
Không may, chúng ta không thể quan sát các ut một cách trực tiếp mà chỉ quan sát được đại diện của chúng là et hay còn gọi là phần dư

predict s1, resid
gen s1_100=100*s1
label var s1_100 “Residuals”
predict s2, rstandard
twoway (line s1_100 time) (line s2 time)

hiện tượng tự tương quan

Xem thêm: Cách vẽ đồ thị trong Stata

Dạng đồ thị phần dư và nhận dạng loại tự tương quan

Tự tương quan dương:

Tự tương quan âm:

Không có tự tương quan:

3.2. Nhận biết tự tương quan bằng kiểm định Durbin-Watson với tài liệu chuỗi thời hạn

Nhớ khai báo dữ liệu chuỗi thời gian bằng câu lệnh: tset timevar (trong đó timevar là biến thời gian của mô hình) cho Stata nhận nhé!

Lưu ý: Sau khi hồi quy mô hình thì mới dùng 3 cách dưới để kiểm định tự tương quan.

Giả thuyết H0:

H0 : Mô hình không xảy ra hiện tượng kỳ lạ tự tương quanH1 : Mô hình xảy ra hiện tượng kỳ lạ tự tương quan

Cách 1: Kiểm định bằng phương pháp Durbin-Watson

Dùng lệnh: dwstat

Cách 2: Sử dụng Durbin’s alternative để hiện mức ý nghĩa cho cách 1

Bạn có biết: Kiểm định Durbin-Watson có thể được ánh xạ tuyến tính theo mối tương quan Pearson giữa các giá trị và độ trễ của chúng.

Dùng lệnh: estat durbinalt

kiểm định durbin-watson

Funfact: Trong phần này MOSL hướng dẫn các bạn cách tra bảng kiểm định durbin watson bởi vì nó khá phức tạp và thực sự không cần thiết khi đã có các phần mềm data analysis hiện đại giúp bạn làm điều này.

Cách 3: Sử dụng kiểm định Breusch-Godfrey

Lưu ý: Tự tương quan của các bậc cao hơn và có thể áp dụng cho dù các bộ hồi quy có bao gồm độ trễ của biến phụ thuộc hay không còn được gọi là thử nghiệm Breusch-Godfrey.

Lệnh: bgodfrey

Kết quả từ cách 2 và cách 1 đều cho p-value < 0.05 nên ta bác bỏ H0 và kết luận mô hình xảy ra hiện tượng tự tương quan.

3.3. Nhận biết tự tương quan bằng lệnh xtserial với tài liệu bảng

Sử dụng bộ dữ liệu bảng và setup dữ liệu cho Stata hiểu bằng câu lệnh: xtset bank YEAR

Sau khi hồi quy mô hình dùng lệnh: xtserial [BPT] + [BĐL] như hình dưới

Kết quả với bộ tài liệu này thì p-value = 0.0849 > 0.05 nên gật đầu H0 và Tóm lại quy mô không xảy ra hiện tượng kỳ lạ tự tương quan .

4. Cách khắc phục hiện tượng kỳ lạ tự tương quan trong stata

Giống như trong trường hợp của phương sai đổi khác, bạn cần sử dụng đến ước đoán dựa trên cơ sở kinh nghiệm tay nghề ( educated guess ) hoặc một loại chuyển hóa nào đó về quy mô hồi quy gốc để trong quy mô đã được chuyển hóa không còn gặp phải yếu tố tương quan chuỗi nữa. Có nhiều cách khắc phục như sau :

Xem thêm: Phương sai thay đổi là gì?

4.1. Chuyển hóa sai phân bậc 1

Với cách này bạn sẽ đưa hàng loạt tài liệu về dạng sai phân bậc 1 tức là lấy hiệu số giữa hai kỳ quan sát thứ t và t-1 cho mỗi biến trong quy mô .
May thay trong Stata bạn không cần làm phức tạp như vậy mà chỉ cần dùng lệnh D. ở phía trước những biến như sau :

reg D.Y D.X1 D.X2 D.X3

4.2. Chuyển hóa tổng hóa

Các giá trị ước lượng p của các tham số thu được vì thế được biết với tên gọi là các ước lượng bình phương bé nhất tổng quát khả thi viết tắt là FGLS (Feasible Generalized Least Squares estimators).

Tham khảo ngay nếu chưa biết Mô hình FGLS là gì? nhé!

Trong ứng dụng Stata so với tài liệu bảng ta có lệnh sau để khắc phục hiện tượng kỳ lạ tự tương quan :

xtgls [BPT][BĐL],corr(ar1)

Với giả định ut theo chính sách AR ( 1 ) là tương thích, hồi quy et theo et-1, sử dụng et làm biến đại diện thay mặt cho ut, một giả định hoàn toàn có thể tương thích trong những mẫu lớn, chính bới trong những mẫu lớn 𝜌 ̂ là ước đạt đồng nhất của giá trị ước đạt p .

4.3. Phương pháp Newey-West để kiểm soát và điều chỉnh những số chuẩn của OLS

Nhưng nếu cỡ mẫu lớn, thì bạn có thể ước lượng hồi quy OLS theo cách thông thường, nhưng điều chỉnh các sai số chuẩn của các hệ số hồi quy, theo một phương pháp được đề xuất bời Newey và West. Các sai số chuẩn được điều chỉnh theo thủ tục của họ cũng được biết với tên gọi các sai số chuẩn HAC (heteroscedasticity and autocorrelation consistent). Nói chung, nếu có tự tương quan, các sai số theo phương pháp HAC được tìm thấy lớn hơn các sai số chuẩn theo phương pháp OLS thông thường.

Thực hiện bằng 1 trong 2 cách sau trong ứng dụng Stata :

reg Y X1 X2 X3, vce(robust) hoặc ewey Y X1 X2 X3, lag(n)

Khi dùng lệnh newey phải thêm giá trị biến trễ thấp nhất là 1 để thay đổi bậc tương quan.

4.4. Thêm biến trễ vào biến nhờ vào trong quy mô

Có thể thêm biến trễ cho biến phụ thuộc vào trong trường hợp biến này bị tương quan giữa hai quá trình t và t – 1 với lệnh như sau :

reg Y  L.Y X1 X2 X3             (Nếu chỉ muốn biến phụ thuộc với độ trễ 1)

reg Y  L(1/2).Y X1 X2 X3       (Nếu muốn biến phụ thuộc với độ trễ 1 và 2)

Sau khi thêm biến trễ vào biến phụ thuộc vào nhớ dùng kiểm định test lại nhé !

Xem thêm: Cách khắc phục và kiểm định tự tương quan trong các phần mềm khác như R, SPSS, EVIEW…

5. Kết luận

Như vậy MOSL đã trình làng cho những bạn hiện tượng kỳ lạ tự tương quan là gì – nguyên do, hậu quả và cách phát hiện cũng như khắc phục trong ứng dụng Stata .
Hy vọng với bài viết này những bạn sẽ chớp lấy rõ được tự tương quan là gì và vận dụng vào giải bài tập được giao !
MOSL xin chúc những bạn học tập và thao tác hiệu suất cao !

5/5 – ( 2 bầu chọn )

5/5 - (1 vote)

Bài viết liên quan

Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments