Ứng dụng mạng nơron trong dự báo ARIMA – Phân tích xử lý dữ liệu

Ứng dụng mạng nơron trong dự báo ARIMA, trong bài viết này chúng tôi tập trung chuyên sâu và những định nghĩa và những bước triển khai dự báo ARIMA khi tích hợp mạng nơ-ron ( Neural Network ) trong dự báo ARIMA, mà chúng tôi không tập trung chuyên sâu vào hướng dẫn những bạn dự báo bằng ARIMA vì có nhiều bài viết về chủ đề này rồi, những bạn hoàn toàn có thể xem : Dự báo ARIMA trên SPSS, Dự báo ARIMA trên Eviews, Dự báo ARIMA tự động hóa trên R …. Để tìm hiểu thêm về cách dự báo ARIMA, trong bài viết này chúng tôi tập trung chuyên sâu vào ứng dụng mạng nơ-ron để dự báo ARIMA .

ANN là gì ?

Artificial Neural Network ( ANN ) gồm 3 thành phần chính : Input layer và output layer chỉ gồm 1 layer, hidden layer hoàn toàn có thể có 1 hay nhiều layer tùy vào bài toán đơn cử. ANN hoạt động giải trí theo hướng miêu tả lại cách hoạt động giải trí của hệ thần kinh với những neuron được liên kết với nhau .Trong ANN, trừ input layer thì toàn bộ những node thuộc những layer khác đều full-connected với những node thuộc layer trước nó. Mỗi node thuộc hidden layer nhận vào ma trận nguồn vào từ layer trước và tích hợp với trọng số để ra được hiệu quả. Ở trong course của Andrew Ng trên coursera, thầy sử dụng Logistic Regression ở những node .

 

Bạn đang đọc: Ứng dụng mạng nơron trong dự báo ARIMA – Phân tích xử lý dữ liệu

FFNN là gì ?

Một mạng truyền thẳng là một mạng lưới thần kinh tự tạo trong đó những liên kết giữa những nút làm không tạo chu kỳ luân hồi. Như vậy, nó khác với hậu duệ của nó : mạng lưới thần kinh tái phát. Mạng thần kinh feedforward là loại mạng thần kinh tự tạo tiên phong và đơn thuần nhất được ý tưởng. Trong mạng này, thông tin chỉ chuyển dời theo một hướng, chuyển tiếp, từ những nút nguồn vào, trải qua những nút ẩn ( nếu có ) và đến những nút đầu ra. Không có chu kỳ luân hồi hoặc vòng lặp trong mạng .Trong những năm gần đây, nhiều điều tra và nghiên cứu đã vận dụng những quy mô mạng nơron tự tạo trong dự báo chuỗi thời hạn và đạt được 1 số ít tác dụng nhất định. Bogdan Oancea đã thiết lập quy mô mạng nơron với hai kiến trúc mạng là FFNN ( Feedforward Neural Network ) và RNN ( Recurrent Neural Network ) cho việc dự báo chuỗi thời hạn. Tác giả chạy thực nghiệm trên tập dữ liệu tỷ giá hối đoái giữa đồng EUR / RON và USD / RON. Đầu tiên, tác giả chuẩn hóa dữ liệu bằng công thức logarit tự nhiên để nâng cao độ đúng mực dự báo. Sau đó, quy mô FFNN được kiến thiết xây dựng với 20 nơron ở lớp nguồn vào ( input layer ), 40 nơron ở lớp ẩn ( hidden layer ) và 1 nơron ở lớp đầu ra ( output layer ) là giá trị dự báo cho thời hạn tiếp theo t + 1. Tác giả chia tập tài liệu với 80 % cho huấn luyện và đào tạo ( training ) và 20 % cho thử nghiệm ( testing ). Kế tiếp, mạng RNN được thiết lập với 20 nơron ở lớp nguồn vào, 10 nơron trong lớp ẩn hồi quy và 1 nơron ở lớp đầu ra. Sau khi thực nghiệm, tác giả chứng minh và khẳng định quy mô RNN cho hiệu quả dự báo tốt hơn FFNN trên tập dữ liệu tỷ giá hối đoái .

M. Raeesi sử dụng mạng nơron FFNN để dự báo tài liệu giao thông vận tải ở thành phố Monroe, bang Louisiana, Hoa Kỳ. Nghiên cứu này yêu cầu một mạng nơron sử dụng tài liệu giao thông vận tải của ngày thời điểm ngày hôm nay, ngày trong ngày hôm qua, tuần trước, hai tuần trước, ba tuần trước và một tháng trước để làm đầu vào cho dự báo lưu lượng giao thông vận tải của ngày mai. Kết quả thực nghiệm cho thấy quy mô mạng nơron đã thiết kế xây dựng hoàn toàn có thể được sử dụng cho dự báo giao thông vận tải tại thành phố Monroe. Tuy nhiên, một vài trường hợp có hiệu quả dự báo với sai số lớn do những yếu tố không bình thường ảnh hưởng tác động như tai nạn đáng tiếc, thời tiết xấu, … Kumar Abhishek cũng sử dụng mạng nơron FFNN với giải thuật Viral ngược ( back-propagation ) trong dự báo sàn chứng khoán trên tập tài liệu của tập đoàn lớn Microsoft từ 1/1/2011 đến 31/12/2011 gồm 2 lớp đơn thuần trong mạng ( 10 nơron lớp nguồn vào, 1 nơron lớp đầu ra ), độ đúng mực dự báo lên đến 99 % .Mạng nơron tự tạo lấy sáng tạo độc đáo từ việc mô phỏng hoạt động giải trí của não bộ con người. Mạng nơron tự tạo có nhiều kiến trúc khác nhau như mạng nơron truyền thẳng, mạng nơron tích chập, mạng nơron hồi quy. Trong đó, mạng nơron truyền thẳng ( FFNN ) gồm có một lớp nguồn vào ( input layer ), một hoặc nhiều lớp ẩn ( hidden layer ), lớp đầu ra ( output layer ). Số đặc trưng của tập dữ liệu sẽ tương ứng với số nơron trong lớp nguồn vào. Tất cả những nơron này được liên kết với mỗi nơron trong lớp ẩn trải qua những đường link gọi là “ khớp thần kinh ”. Mỗi “ khớp thần kinh ” sẽ được gán một trọng số ( weight ). Các trọng số này sẽ được kiểm soát và điều chỉnh trong quy trình học của mạng nơron tự tạo để quy mô hóa mối liên hệ giữa lớp nguồn vào và đầu ra .Feedforward : tín hiệu chỉ truyền một chiều từ đầu vào tới đầu ra, chúng khá đơn thuần và thường vận dụng trong nhận dạng mẫu. Hai kiểu thông dụng là CNN hoặc ConvNet thường được sử dụng trong nhận dạng hình ảnh .

CNN là gì ?

Trong học tập sâu, mạng nơ ron tích chập ( CNN hoặc ConvNet ) là một lớp những mạng thần kinh sâu, thường được vận dụng nhất để nghiên cứu và phân tích hình ảnh trực quan. Chúng còn được gọi là mạng nơ ron tự tạo không bao giờ thay đổi hoặc không bao giờ thay đổi khoảng trống ( SIANN ), dựa trên kiến ​ ​ trúc trọng số chung và đặc thù bất biến dịch. [ 2 ] [ 3 ] Họ có những ứng dụng nhận dạng hình ảnh và video, mạng lưới hệ thống yêu cầu, phân loại hình ảnh, nghiên cứu và phân tích hình ảnh y tế, giải quyết và xử lý ngôn từ tự nhiên, và chuỗi thời hạn kinh tế tài chính .CNN ( Convolutional Neural Networks ) là phiên bản chính quy của những tri giác đa lớp. Các tri giác đa lớp thường có nghĩa là những mạng được liên kết rất đầy đủ, nghĩa là, mỗi nơ-ron trong một lớp được liên kết với toàn bộ những nơ-ron ở lớp tiếp theo. Tính “ liên kết khá đầy đủ ” của những mạng này khiến chúng dễ bị quá tải tài liệu. Các cách chính quy điển hình bao gồm thêm 1 số ít dạng đo cường độ của trọng số vào hàm mất. Các CNN có một cách tiếp cận khác so với việc chính quy hóa : họ tận dụng quy mô phân cấp trong tài liệu và lắp ráp những mẫu phức tạp hơn bằng cách sử dụng những mẫu nhỏ hơn và đơn thuần hơn. Do đó, trên quy mô liên kết và độ phức tạp, CNN ở mức cực thấp .Mạng chập được lấy cảm hứng bởi sinh học quy trình trong đó quy mô liên kết giữa những tế bào thần kinh tương tự như như việc tổ chức triển khai động vật hoang dã vỏ não thị giác. Các tế bào thần kinh vỏ não riêng không liên quan gì đến nhau chỉ phân phối với những kích thích trong một khu vực hạn chế của nghành nghề dịch vụ thị giác được gọi là nghành nghề dịch vụ tiếp đón. Các nghành đảm nhiệm của những tế bào thần kinh khác nhau chồng lên nhau một phần sao cho chúng bao trùm hàng loạt trường thị giác .CNN sử dụng tương đối ít tiền giải quyết và xử lý so với những thuật toán phân loại hình ảnh khác. Điều này có nghĩa là mạng khám phá những bộ lọc mà trong những thuật toán truyền thống cuội nguồn được phong cách thiết kế bằng tay. Sự độc lập này từ kiến ​ ​ thức trước và nỗ lực của con người trong phong cách thiết kế tính năng là một lợi thế lớn .

MLP là gì ?

Một Perceptron nhiều lớp ( multilayer perceptron ( MLP ) ) là một lớp những feedforward mạng thần kinh tự tạo ( ANN ). Thuật ngữ MLP được sử dụng một cách mơ hồ, nhiều lúc lỏng lẻo so với bất kể ANN tiếp theo nào, đôi lúc tráng lệ để chỉ những mạng gồm có nhiều lớp tri giác ( có kích hoạt ngưỡng ) ;. Các tri giác đa lớp nhiều lúc được gọi chung là những mạng thần kinh “ vanilla ”, đặc biệt quan trọng khi chúng có một lớp ẩn duy nhất .Một MLP gồm có tối thiểu ba lớp nút : lớp nguồn vào, lớp ẩn và lớp đầu ra. Ngoại trừ những nút nguồn vào, mỗi nút là một nơron sử dụng hàm kích hoạt phi tuyến. MLP sử dụng một kỹ thuật học tập có giám sát được gọi là backpropagation để giảng dạy. Nhiều lớp và kích hoạt phi tuyến tính của nó phân biệt MLP với một tri giác tuyến tính. Nó hoàn toàn có thể phân biệt tài liệu không hề phân tách tuyến tính .

RNN là gì ?

Một mạng lưới thần kinh tái phát ( RNN ) là một lớp học của mạng nơ-ron tự tạo nơi liên kết giữa những nút tạo thành một đồ thị có hướng dọc theo một trình tự thời hạn. Điều này được cho phép nó thể hiện hành vi năng động trong thời điểm tạm thời. Xuất phát từ những mạng thần kinh feedforward, RNN ( Recurrent Neural Networks ) hoàn toàn có thể sử dụng trạng thái bên trong ( bộ nhớ ) của chúng để giải quyết và xử lý những chuỗi độ dài đổi khác của nguồn vào. Điều này làm cho chúng hoàn toàn có thể vận dụng cho những tác vụ như không nhận dạng, nhận dạng chữ viết tay được liên kết hoặc nhận dạng giọng nói .Thuật ngữ mạng nơ-ron tái phát liên tục được sử dụng một cách bừa bãi để chỉ hai loại mạng rộng có cấu trúc chung tựa như nhau, trong đó một là xung hữu hạn và một là xung vô hạn. Cả hai lớp của mạng thể hiện hành vi năng động trong thời điểm tạm thời. Mạng tái phát xung hữu hạn là một đồ thị chu kỳ luân hồi có hướng hoàn toàn có thể không được trấn áp và được sửa chữa thay thế bằng mạng thần kinh cấp tài liệu khắt khe, trong khi mạng tái phát xung vô hạn là đồ thị tuần hoàn có hướng không hề trấn áp được .Feedback ( RNNs ) : tín hiệu được truyền theo cả hai chiều, nó phức tạp hơn nhiều so với CNN, và luôn luôn biến hóa. Trong thực tiễn nó ít tác động ảnh hưởng so với Feedforward do tại những nghiên cứu và điều tra còn khá mới mẻ và lạ mắt .

Tóm tắt cho các bạn nghiên cứu thống kê

Cái tóm tắt này là dạng cá thể điều tra và nghiên cứu, mới chỉ đúng ở hiện tại, còn tương lai thì chờ những bạn nghiên cứu và điều tra tiếp :

  • Mạng nơron nào có 3 lớp thì ta gọi nó là ANN
  • Mạng nơron ANN nào chỉ có truyền thẳng 1 hướng gọi là FFNN
  • Mạng nơron ANN nào truyền từ nghiều hướng gọi là RNN
  • Mạng nơron ANN nào có nhiều lớp thì là MLP ( >= 2 lớp ẩn)
  • Những cái còn lại mình thấy ứng dụng cho những ngành khác, chưa thấy cho thống kê.

Dự báo ARIMA

Xây dựng mô hình nghiên cứu

Mô hình ARIMA, như đã nói ở trên chúng tôi không bàn về việc chạy Mã Sản Phẩm ARIMA mà chúng chọn quy mô ARIMA là AR ( 2 ) ( Tức là quy mô chỉ có tự hồi quy AR mà không có trung bình trượt MA ) như vậy tất cả chúng ta có quy mô điều tra và nghiên cứu để dự báo ARIMA như sau :

Y = AR(1) + AR(2) 

  • Y: Chỉ số VNINDEX
  • AR(1) chỉ số vn-index với độ trễ 1
  • AR(2) chỉ số vn-index với độ trễ 2

Chuẩn hoá dữ liệu

Dữ liệu dùng để thiết kế xây dựng mạng nơron phải là dạng scale và chuẩn hoá min-max ( Chúng ta hoàn toàn có thể chuẩn hoá theo logistic [ 0 ; 1 ] hay tanh [ – 1 ; 1 ] điều được ), tất cả chúng ta chuẩn hoá min-max theo công thức sau :

Ych = (Y-Ymin )/(Ymax-Ymin)

Ta lấy tài liệu đã chuẩn hoá chia thành 2 phần : 80 % để chạy tập huấn và 20 % để chạy kiểm tra ( tất cả chúng ta hoàn toàn có thể lấy tỉ lệ khác )

Chạy tập huấn dữ liệu

Trước khi bàn về tác dụng thì tất cả chúng ta thoã thuận trước như sau :

  • Chúng ta chỉ chạy 1 lớp ẩn  ( các bạn có thể chạy lên 2 hoặc 3…)
  • Chúng ta cần chạy từ 1 đến 100 nơron (node), để tìm model phù hợp nhất, vì tôi đã chạy trước nên số lượng node phù hợp là : 5 ( Các bạn cần phải hạy hết để kiểm tra).

Để triển khai ví dụ này chúng tôi sử dụng gói neuralne trong ứng dụng R

Chạy kiểm tra

Chúng ta test lại với 20 % tài liệu còn lại xem có đúng không ?

## thucte uocluong
## 1 0.57895345 0.5563011
## 2 0.28019350 0.5780993
## 3 0.09660974 0.5549046
## 4 0.47131231 0.5667600
## 5 0.39524692 0.5741981
## 6 0.53287267 0.5592369
## 7 0.57997577 0.5623722
## 8 0.29950021 0.5571277
## 9 0.35920811 0.5548869
## 10 0.01758944 0.5660083
## 11 0.45922573 0.5635551
## 12 0.97589064 0.5774018
## 13 0.60854794 0.5607967
## 14 0.58125548 0.5407993
## 15 0.12619105 0.5542512
## 16 0.56120287 0.5546772
## 17 0.79491920 0.5730296
## 18 0.83928584 0.5565283
## 19 1.00000000 0.5480892
## 20 0.67743875 0.5471242
## 21 0.57340480 0.5401839

Chúng ta tính những chỉ số RMSE, MAPE, MAE, … .

  • RMSE = sqrt (sum(thucte – uocluong)/n) = 0.024
  • MAPE = 1/n * sum(|thucte-uocluong|/|thucte|)
  • MAE = 1/n * sum(|thucte-uocluong|)

Như vậy chúng ta có RMSE nhỏ nhất tại 0.024, khi node=5 và hidden layer =1

Giờ dự báo thôi .

Dự báo ARIMA ứng dụng mạng nơron

Cái phần màu xanh blue chính là phần dự báo của quy mô. Đến đây thì tất cả chúng ta đã hoàn thành xong tiềm năng của bài viết này : ứng dụng mạng nơron trong dự báo arima .

Tóm tắt

Trên đây là chúng tôi sử dụng kết họp ứng dụng mạng nơron vào dự báo ARIMA, nếu những bạn có nghiên cứu và điều tra khoa học tương quan tới mạng nơron, những bạn đừng ngần ngại hãy liên hệ ngay với chúng tôi để được tư vấn dịch vụ không lấy phí .SummaryReviewer

Tuổi Trẻ

Review Date2020 – 06-26Reviewed Item

Tài liệu quá hay

Author Rating

5

1starProduct Name

Hướng dẫn ứng dụng mạng nơron

Price

VND3000000

Product Availability

Available in Stock

Rate this post
Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments