Mô hình GARCH- Giới thiệu
FA4Vietnam xin biên dịch bài viết "Basic Introduction to GARCH and EGARCH" từ Quantum Financier- một blog khá thú vị được thực hiện bởi một trader người Canada. Bài viết được viết theo văn phong của người không làm công việc hàn lâm, một vài thuật ngữ có thể chưa trùng khớp với các sách giáo khoa về thống kê hoặc kinh tế lượng, nhưng tạo sự thoải mái cho người đọc.
Nguyên văn bài viết các bạn có thể theo dõi tại đây.
Phần 1
Một trong những công cụ thống kê được sử dụng trong tài chính là mô hình bình phương nhỏ nhất (least square model- không nhất thiết là bình phương nhỏ nhất tuyến tính). Đối với người mới học, mô hình bình phương nhỏ nhất được sử dụng để xác định sự biến động của một biến phụ thuộc liên quan đến sự thay đổi của những biến khác- được gọi là biến độc lập. Khi làm việc với mô hình, sự sai khác giữa giá trị được dự báo (predicted value) và giá trị thực (actual value) được gọi là error term- phần sai số, hoặc residual- phần dư và được thể hiện bằng chữ cái Hy Lạp epsilon.
Khi chúng ta hiệu chỉnh một mô hình, chúng ta quan tâm đến việc phân tích độ lớn của phần sai số. Một trong những giả thiết cơ bản của mô hình bình phương nhỏ nhất là phần sai số bình phương là cố định trên mọi điểm dữ liệu trong mô hình. Thuật ngữ được sử dụng cho hiện thượng phương sai bằng nhau này được gọi là homoskedasticity. Tuy nhiên, với sự biến động của dữ liệu chuỗi thời gian, phương sai không thể được giả định là cố định trong mọi trường hợp. Nếu nhìn vào dữ liệu thời gian trong tài chính, chúng ta có thể thấy ở một vài giai đoạn, dữ liệu có sự biến động nhiều hơn so với các giai đoạn khác. Như vậy, khi chúng ta hiệu chỉnh một mô hình, điều này sẽ dẫn đến việc phần dư có cường độ lớn hơn. Thêm vào đó, những "đỉnh nhọn" của phương sai không phải là ngẫu nhiên được sắp đặt theo thời gian; thay vào đó là sự hiện hữu của tác động tự tương quan (auto- correlation). Nói đơn giản, chúng ta gọi nó là "volatility clustering", nghĩa là những thời đoạn mà phương sai lớn có xu hướng nhóm lại cùng nhau. Phương sai không cố định được gọi là heteroskedasticity. Và đây là lúc mô hình GARCH được sử dụng và giúp chúng ta tìm các thước đo giao động dùng để dự đoán phần dư trong các mô hình.
Trước khi nói đến mô hình GARCH, tôi sẽ giới thiệu nhanh về họ hàng gần nhất của nó- mô hình ARCH (Autoregressive conditional heteroskedasticity). Chúng ta cùng xem xét phương án dễ nhất nhằm dự đoán biến động: the rolling x day standard deviation. Chúng ta nhìn vào nó theo dữ liệu cả năm. Khi có được giá trị lịch sử của độ lệch chuẩn (standard deviation), chúng ta muốn dự đoán giá trị này cho ngày kế tiếp. Các thống kê về xu hướng trung tâm cho chúng ta thấy giá trị trung bình là sự dự đoán tốt nhất.
Sử dụng giá trị trung bình, 252 quan sát trong năm có trọng số ngang bằng nhau. Tuy nhiên, sẽ hợp lý hơn nếu các quan sát gần thời điểm hiện tại nhất có trọng số lớn hơn? Chúng ta có thể sử dụng trung bình trọng số theo cấp số nhân (exponentially weighted average) để giải quyết vấn đề này, nhưng đây cũng không phải là phương án tốt nhất. Nguyên do là nó quên đi các điểm dữ liệu có trước đây 252 ngày (trọng số bằng 0). Cách tính trọng số này không phải lựa chọn tốt với các nhà đầu tư quan tâm thiên về định lượng. Mô hình ARCH được áp dụng khi trong số được áp dụng lên phân dự được tính toán tự động để có được các tham số tốt nhất. Mô hình ARCH tổng quát (Generalized ARCH model- GARCH) cũng dựa trên cùng nguyên tắc nhưng theo thời gian, trọng số sẽ nhỏ hơn nhưng không bao giờ bằng 0.
Trong các bài viết trước, tôi sử dụng mô hình GARCH với thứ tự (1,1). Mô hình này sẽ dự đoán phương sai bằng cách sử dụng trung bình có trong số của phương sai trong dữ liệu lịch sử, phương sai được dự đoán cho thời đoạn (số 1 thứ hai trong mô hình còn được gọi là số GARCH) và phần dư bình phương của ngày trước đó (số 1 thứ nhất, được gọi là số ARCH). Hoặc cụ thể hơn là:
Trong đó h là phương sai, là phần dư bình phương (squared residual), t là thời đoạn. Hằng số phải được ước tính và được cập nhật bằng mô hình trong từng thời đoạn sử dụng khả năng cực đại (maximum likelihood). Phần diễn giải cho phương pháp này nằm ngoài phạm vi của blog, tôi khuyến nghị sử dụng phần mềm thống kê như R để thực hiện). Thêm vào đó, người sử dụng có thể thay đổi các số ARCH và GARCH (thay vì 1,1) trong mô hình của họ. Đôi khi, nhiều lags hơn là cần thiết để có sự dự đoán biến động một cách chính xác.
Lưu ý đối với người sử dụng: Đây không phải là "thuốc tiên" và các giá trị dự đoán có thể khác biệt hoàn toàn với phương sai thực sự. Luôn luôn kiểm tra lại và tiến hành các loại kiểm định như Ljung box để kiểm chứng rằng không tồn tại hiện tượng tự tương quan trong phần dư bình phương.
(còn tiếp)
Nguyên văn bài viết các bạn có thể theo dõi tại đây.
Phần 1
Một trong những công cụ thống kê được sử dụng trong tài chính là mô hình bình phương nhỏ nhất (least square model- không nhất thiết là bình phương nhỏ nhất tuyến tính). Đối với người mới học, mô hình bình phương nhỏ nhất được sử dụng để xác định sự biến động của một biến phụ thuộc liên quan đến sự thay đổi của những biến khác- được gọi là biến độc lập. Khi làm việc với mô hình, sự sai khác giữa giá trị được dự báo (predicted value) và giá trị thực (actual value) được gọi là error term- phần sai số, hoặc residual- phần dư và được thể hiện bằng chữ cái Hy Lạp epsilon.
Khi chúng ta hiệu chỉnh một mô hình, chúng ta quan tâm đến việc phân tích độ lớn của phần sai số. Một trong những giả thiết cơ bản của mô hình bình phương nhỏ nhất là phần sai số bình phương là cố định trên mọi điểm dữ liệu trong mô hình. Thuật ngữ được sử dụng cho hiện thượng phương sai bằng nhau này được gọi là homoskedasticity. Tuy nhiên, với sự biến động của dữ liệu chuỗi thời gian, phương sai không thể được giả định là cố định trong mọi trường hợp. Nếu nhìn vào dữ liệu thời gian trong tài chính, chúng ta có thể thấy ở một vài giai đoạn, dữ liệu có sự biến động nhiều hơn so với các giai đoạn khác. Như vậy, khi chúng ta hiệu chỉnh một mô hình, điều này sẽ dẫn đến việc phần dư có cường độ lớn hơn. Thêm vào đó, những "đỉnh nhọn" của phương sai không phải là ngẫu nhiên được sắp đặt theo thời gian; thay vào đó là sự hiện hữu của tác động tự tương quan (auto- correlation). Nói đơn giản, chúng ta gọi nó là "volatility clustering", nghĩa là những thời đoạn mà phương sai lớn có xu hướng nhóm lại cùng nhau. Phương sai không cố định được gọi là heteroskedasticity. Và đây là lúc mô hình GARCH được sử dụng và giúp chúng ta tìm các thước đo giao động dùng để dự đoán phần dư trong các mô hình.
Trước khi nói đến mô hình GARCH, tôi sẽ giới thiệu nhanh về họ hàng gần nhất của nó- mô hình ARCH (Autoregressive conditional heteroskedasticity). Chúng ta cùng xem xét phương án dễ nhất nhằm dự đoán biến động: the rolling x day standard deviation. Chúng ta nhìn vào nó theo dữ liệu cả năm. Khi có được giá trị lịch sử của độ lệch chuẩn (standard deviation), chúng ta muốn dự đoán giá trị này cho ngày kế tiếp. Các thống kê về xu hướng trung tâm cho chúng ta thấy giá trị trung bình là sự dự đoán tốt nhất.
Sử dụng giá trị trung bình, 252 quan sát trong năm có trọng số ngang bằng nhau. Tuy nhiên, sẽ hợp lý hơn nếu các quan sát gần thời điểm hiện tại nhất có trọng số lớn hơn? Chúng ta có thể sử dụng trung bình trọng số theo cấp số nhân (exponentially weighted average) để giải quyết vấn đề này, nhưng đây cũng không phải là phương án tốt nhất. Nguyên do là nó quên đi các điểm dữ liệu có trước đây 252 ngày (trọng số bằng 0). Cách tính trọng số này không phải lựa chọn tốt với các nhà đầu tư quan tâm thiên về định lượng. Mô hình ARCH được áp dụng khi trong số được áp dụng lên phân dự được tính toán tự động để có được các tham số tốt nhất. Mô hình ARCH tổng quát (Generalized ARCH model- GARCH) cũng dựa trên cùng nguyên tắc nhưng theo thời gian, trọng số sẽ nhỏ hơn nhưng không bao giờ bằng 0.
Trong các bài viết trước, tôi sử dụng mô hình GARCH với thứ tự (1,1). Mô hình này sẽ dự đoán phương sai bằng cách sử dụng trung bình có trong số của phương sai trong dữ liệu lịch sử, phương sai được dự đoán cho thời đoạn (số 1 thứ hai trong mô hình còn được gọi là số GARCH) và phần dư bình phương của ngày trước đó (số 1 thứ nhất, được gọi là số ARCH). Hoặc cụ thể hơn là:
Trong đó h là phương sai, là phần dư bình phương (squared residual), t là thời đoạn. Hằng số phải được ước tính và được cập nhật bằng mô hình trong từng thời đoạn sử dụng khả năng cực đại (maximum likelihood). Phần diễn giải cho phương pháp này nằm ngoài phạm vi của blog, tôi khuyến nghị sử dụng phần mềm thống kê như R để thực hiện). Thêm vào đó, người sử dụng có thể thay đổi các số ARCH và GARCH (thay vì 1,1) trong mô hình của họ. Đôi khi, nhiều lags hơn là cần thiết để có sự dự đoán biến động một cách chính xác.
Lưu ý đối với người sử dụng: Đây không phải là "thuốc tiên" và các giá trị dự đoán có thể khác biệt hoàn toàn với phương sai thực sự. Luôn luôn kiểm tra lại và tiến hành các loại kiểm định như Ljung box để kiểm chứng rằng không tồn tại hiện tượng tự tương quan trong phần dư bình phương.
(còn tiếp)
Tuyet voi qua, cam on bạn, nhưng mình vẫn không hiểu một cách cụ thể là Garch mục đích trong ứng dụng là dự báo như thế nào? ví dụ tìm được phương sai rồi thì làm sao dự báo.
ReplyDelete