[ Regular Paper ]

JOURNAL OF BROADCAST ENGINEERING - Vol. 30, No. 3, pp.461-479

ISSN: 1226-7953 (Print) 2287-9137 (Online)

Print publication date 31 May 2025

Received 29 Apr 2025 Revised 12 May 2025 Accepted 12 May 2025

DOI: https://doi.org/10.5909/JBE.2025.30.3.461

환경 정보를 활용한 딥러닝 학습 기반의 네트워크 트래픽 예측에 관한 연구

김정윤^a)

; 유인태^a)^{, ‡}

; 김규헌^b)

a)경희대학교 컴퓨터공학부
b)경희대학교 전자정보대학

A Study on Network Traffic Prediction Based on Deep Learning Training Using Environmental Information

Jungyun Kim^a)

; Intae Ryoo^a)^{, ‡}

; Kyuheon Kim^b)

a)Department of Computer Eng., Kyung Hee University
b)Department of Electronic Eng., Kyung Hee University

Correspondence to: ^‡유인태(Intae Ryoo) E-mail: itryoo@khu.ac.kr Tel: +82-31-201-2599

Copyright © 2025 Korean Institute of Broadcast and Media Engineers. All rights reserved.
“This is an Open-Access article distributed under the terms of the Creative Commons BY-NC-ND (http://creativecommons.org/licenses/by-nc-nd/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited and not altered.”

초록

네트워크 인프라가 점점 더 복잡해짐에 따라, 정확한 트래픽 예측은 자율 운영을 위한 핵심 요소로 부상하고 있다. 본 연구는 실제 네트워크 트래픽 데이터와 기상 환경 정보를 통합하여 다변량 시계열 예측 모델을 구성하였다. 초기 실험에서는 8개의 환경 정보를 모두 포함할 경우 상관관계 부족 및 다중공선성으로 인해 오히려 성능이 저하되는 결과가 나타났다. 이에 Maximum Value, Average Temperature, Maximum Temperature, Total Sunlight Hours의 4개 변수만을 선택하고, 하이퍼파라미터(Epoch=900, Batch Size=14)를 최적화하여 모델을 재학습한 결과, RNN, LSTM, GRU 모두에서 성능이 개선되었다. 그중 RNN 모델이 MSE 34.3964, MAE 4.4220, MAPE 0.3533%, R² 0.9999로 가장 우수한 성능을 보였음을 확인하였다. GRU와 LSTM 역시 안정적인 성능을 나타냈으나, 과도한 Epoch에서는 과적합이 발생할 수 있음이 관찰되었다. 순열 기반 중요도 분석을 통해 모델별로 입력 변수에 대한 민감도가 상이함을 확인하였으며, 특정 날짜에 공통적으로 예측 오차가 급증하는 이상 현상은 모델이 외부 환경 변화에 민감하게 반응함을 시사한다. 결과적으로, 본 논문에서 제안된 모델은 환경 정보 통합을 통해 예측 정확도와 적응성을 향상시켰으며, 이는 지능형 네트워크 자원 제어에 효과적으로 활용될 수 있음을 입증하고자 하였다.

Abstract

As network infrastructure continues to grow in complexity, accurate traffic forecasting has emerged as a critical element for autonomous network operations. This study proposes a multivariate time series prediction model that integrates real-world network traffic data with meteorological environmental variables. Initial experiments revealed that including all eight environmental variables resulted in performance degradation due to low correlation and multicollinearity among features. Consequently, only four key variables—Maximum Value, Average Temperature, Maximum Temperature, and Total Sunlight Hours—were selected, and the model was retrained with optimized hyper-parameters (Epoch=900, Batch Size=14). As a result, all models (RNN, LSTM, GRU) demonstrated improved performance, with the RNN model achieving the best results: MSE of 34.3964, MAE of 4.4220, MAPE of 0.3533%, and R² of 0.9999. While GRU and LSTM also exhibited stable performance, signs of overfitting were observed when the number of epochs was excessive. Permutation Importance analysis showed that the models responded differently to input variables, depending on their architecture. In addition, a sudden increase in prediction error on specific dates indicates that the models are sensitive to anomalous traffic patterns or external environmental fluctuations. Overall, the proposed model demonstrated enhanced prediction accuracy and adaptability by incorporating environmental information, proving its potential for practical use in intelligent network resource control and traffic forecasting systems.

Keywords:

GRU, RNN, LSTM, Deep Learning, Permutation Importance

Ⅰ. 서 론

최근 연구에 따르면, 네트워크 기술의 비약적인 발전과 사물인터넷(Internet of Things, IoT) 기기의 확산은 초연결 사회(Hyper-connected Society)를 실현하는 핵심 기반으로 작용하고 있으며, 이는 네트워크 인프라의 구조적 복잡성을 증가시키고 있다^[1][2]. 과거에는 네트워크에 연결되는 장치가 주로 서버나 개인용 컴퓨터에 국한되었으나, 현재에는 스마트폰, 노트북, 스마트홈 기기, 산업용 센서 등 IoT 기반 장치까지 포함되며 그 범위가 급격히 확장되고 있다. 이러한 변화는 클라우드 컴퓨팅의 고도화와 IoT 기술의 보급에 기인하며, 데이터 처리 및 네트워크 전송 구조 전반에 근본적인 전환을 가져오고 있다. 특히, 비디오·오디오 스트리밍, 실시간 협업 플랫폼, 웹 기반 애플리케이션의 대중화는 네트워크 트래픽 증가의 주요 원인이 되고 있다. NOKIA의 글로벌 네트워크 트래픽 보고서에 따르면, 2023년부터 2033년까지 산업 트래픽은 연평균 40%~58%, 기업 트래픽은 14%~22%의 비율로 증가할 것으로 예측되며, 총 트래픽은 638EB/month에서 1,749EB/month에 이를 것으로 전망된다^[3]. 이러한 급격한 증가는 인공지능(Artificial Intelligence, AI), 확장현실(eXtended Reality, XR), 산업용 IoT(Industrial IoT) 등 차세대 기술의 확산과 기업의 디지털 전환 가속화에 따른 결과로 해석된다.

이러한 환경 속에서 현대 네트워크는 다양한 장치들이 복합적으로 연결된 구조를 가지며, 단일 장애 발생 시 전체 서비스 품질(Quality of Service, QoS)에 치명적인 영향을 미칠 수 있다^[4]. 물리적 장비의 성능 향상과 가상화 기술의 도입에도 불구하고, 네트워크 트래픽 관리와 자원 운영은 여전히 경험 중심의 수작업에 의존하는 경우가 많다. 이로 인해 운영 리스크, 과도한 유지 비용, 그리고 숙련된 인력 확보의 어려움 등 다양한 문제가 동반된다. 이를 해결하기 위해 최근에는 인공지능 기반의 지능형 네트워크 운용이 대안으로 떠오르고 있다. 특히, 시계열 예측에 강점을 가진 딥러닝 기반 모델 RNN(Recurrent Neural Network), LSTM(Long Short-Term Memory), GRU(Gated Recurrent Unit) 등을 활용하면, 과거의 네트워크 트래픽 데이터를 기반으로 미래의 트래픽을 예측할 수 있어 선제적인 자원 할당과 트래픽 제어가 가능하다^[5,6]. 나아가 이러한 예측 기반 네트워크는 데이터가 누적될수록 정확도가 향상되어, 궁극적으로는 자기 진화형(Self-Evolving) 네트워크로의 발전 가능성도 지닌다^[7]. 기존의 트래픽 예측 연구들은 대부분 트래픽 데이터 자체의 시계열 정보에 집중하였으나, 실제 환경에서는 기온, 풍속, 일조시간 등 외부 기상 요인이 트래픽에 영향을 미치는 경우가 많다^[8]. 그러나 환경 정보를 통합한 네트워크 트래픽 예측에 대한 실증적 연구는 아직 미흡하며, 이에 대한 정량적 검증과 변수 선택 전략은 실질적으로 필요한 상황이다.

Fig. 1.

Enterprise and industrial traffic, global, EB/month[3]

본 연구는 그림 2와 같이, 트래픽 데이터와 환경 정보(평균 기온, 최고 기온, 최대 풍속 등)를 통합하여 다변량 시계열 데이터로 구성한 후, RNN, LSTM, GRU 모델에 입력하였다. 모델 성능은 MSE, RMSE, MAE, R², MAPE 등의 정량 지표를 통해 성능 분석을 수행한다. 특히, 환경 정보를 포함한 모델과 제외한 모델을 동일 조건에서 비교함으로써, 외부 정보가 실제 예측 성능에 미치는 영향을 정량적으로 분석하였다. 또한 변수별 예측 기여도를 순열 기반 중요도로 분석하여, 각 기상 변수의 상대적 중요도를 모델별로 비교하였다. 실험은 한국남동발전의 실제 네트워크 트래픽 데이터를 기반으로 수행되었으며, 환경 변수 8개를 포함한 데이터와, 상관계수가 높은 4개 변수만을 선택하여 구성된 축소 모델을 각각 비교하였다. 실험 과정에서는 다양한 Epoch 및 Batch Size 조합을 통해 모델 성능의 민감도를 분석하였고, 모델별 평균 MSE, RMSE, MAE, R², MAPE 등 다중 지표를 기반으로 성능을 평가하였다. 본 연구는 환경 정보의 무분별한 사용이 예측 성능을 오히려 저해할 수 있음을 보이는 한편, 변수 선택과 모델 설계의 정교함이 성능 향상에 미치는 영향을 실증적으로 제시한다. 이를 통해 기상 정보 기반의 지능형 네트워크 예측 시스템 설계에 있어, 환경 변수 설계 및 하이퍼파라미터 최적화 전략의 중요성을 강조하며, 향후 자율 네트워크 및 분산 인프라 설계에 유용한 시사점을 제공한다.

Fig. 2.

Overview of Multivariate Time Series Prediction Experiment Using Traffic and Environmental Data

Ⅱ. 관련 연구

1. 네트워크 트래픽 예측

네트워크 트래픽 예측은 효율적인 자원 관리와 장애 예방을 위한 핵심 기술로, 정밀한 수요 예측을 통해 QoS 향상과 네트워크 자율 운영 기반 구축에 필수적인 역할을 한다. 초기에는 ARIMA, SARIMA 등과 같은 통계 기반의 시계열 모델이 주로 사용되었으나, 네트워크 트래픽의 비선형적이고 불규칙한 특성을 반영하는 데 한계가 있었다. 이러한 한계를 극복하기 위해 Random Forest, Gradient Boosting, XGBoost 등 전통적인 기계학습(Machine Learning, ML) 기법들이 활용되기 시작하였으며, 이는 상대적으로 적은 데이터에서도 빠른 학습과 높은 해석력을 제공하는 장점이 있다^[9]. 그러나 이들 모델은 시계열의 시간 종속성을 명시적으로 반영하지 못해, 트래픽의 순차적 변화나 장기 패턴을 포착하는 데에는 구조적인 제약이 따른다.

이에 따라 시계열 예측에 특화된 심층 신경망(Deep Neural Network, DNN) 기반 모델의 연구가 활발히 진행되고 있으며, 특히 RNN, LSTM, GRU와 같은 순환 신경망 계열 모델이 대표적으로 활용되고 있다. 이러한 모델들은 과거 시점의 정보를 내부 상태에 기억하며, 시계열 데이터의 시간 의존성을 효과적으로 반영할 수 있는 구조를 갖는다. 최근에는 CNN-LSTM 구조나 GRU 기반 하이브리드 모델을 통해 공간적 특징과 시간적 특징을 동시에 반영하는 방식이 주목받고 있으며, 예측 정확도 또한 기존 단일 모델 대비 우수한 성능을 보이는 것으로 나타났다^[10,11]. 예를 들어, Butterworth 필터를 이용하여 고주파와 저주파 성분을 분리한 뒤 CNN–LSTM 모델로 예측을 수행한 연구에서는 고빈도 트래픽 진동까지 안정적으로 예측 가능함을 보였다. 또한 선형 회귀 기반 모델과 비선형 신경망을 결합한 하이브리드 방식도 제안되고 있으며, 이는 선형/비선형 패턴을 동시에 학습함으로써 기존 예측 모델의 한계를 보완하는 접근으로 평가받고 있다^[12].

Table 1.

Summary of Network Traffic Prediction Papers

2. 시계열 딥러닝 모델

시계열 예측에서 딥러닝 기반 모델은 장기 의존성(Long-Term Dependency)을 학습할 수 있는 구조로 주목받고 있다. RNN은 순차적 입력 간의 시간적 상관관계를 반영할 수 있는 기본 구조를 가지며, 음성 인식, 자연어 처리, 트래픽 예측 등 다양한 시계열 문제에 활용되어 왔다^[13]. 그러나 RNN은 학습 과정에서 기울기 소실(Vanishing Gradient) 문제로 인해 장기적인 패턴을 학습하는 데 어려움이 있다는 한계를 갖는다. 이러한 문제를 극복하기 위해 LSTM 모델이 제안되었다. LSTM은 셀 상태(Cell State)와 게이트(Gate) 구조를 통해 중요한 정보를 장기간 보존하고 불필요한 정보를 제거함으로써 장기 의존성 학습에 유리한 구조를 갖춘다. 특히, 반복 구조 내에서 정보를 선택적으로 유지하거나 버릴 수 있어, RNN 대비 더 안정적인 학습이 가능하다^[14]. GRU는 LSTM의 구조를 단순화하여 계산량을 줄인 형태로, 업데이트 게이트와 리셋 게이트만을 사용하여 LSTM과 유사한 성능을 보다 적은 학습 파라미터로 구현할 수 있다. 특히 GRU는 최근 다양한 시계열 예측 분야에서 높은 성능과 빠른 수렴 속도를 보이며 실용적인 대안으로 각광받고 있다^[15]. 또한 최근 연구에 따르면, 동일한 시계열 데이터를 학습시켰을 때 LSTM은 기후나 트렌드와 같이 장기적인 흐름에 민감하게 반응하고, GRU는 상대적으로 빠른 반응성과 경량화를 통해 실시간 적용에 유리하다는 분석 결과도 제시되고 있다. 특히 순열 기반 중요도 분석을 통해 RNN, LSTM, GRU 모델이 동일한 입력 변수에 대해서도 각기 다른 해석 패턴을 보이는 것이 확인되었으며, 이는 모델 구조에 따라 변수 민감도가 달라질 수 있음을 시사한다.

Table 2.

Summary of papers on time series deep learning models

3. 환경 정보 기반 트래픽 예측

최근 연구에서는 네트워크 트래픽 예측 정확도를 향상시키기 위해 환경 정보(기온, 풍속, 습도, 일조량 등)와 같은 외부 요인을 모델에 통합하려는 시도가 활발히 이루어지고 있다. 특히 LSTM과 같은 시계열 딥러닝 모델은 장기적인 시간 의존성을 학습할 수 있어, 날씨 정보가 트래픽에 미치는 영향을 반영하는 데 유리한 구조를 갖는다. 실제로 도로 교통량 예측 분야에서는 기온, 강수량, 시계(Visibility), 풍속 등의 환경 변수가 단기 및 중장기 예측 성능에 유의미한 영향을 미치는 것으로 보고되었으며, 이러한 변수들은 딥러닝 기반 모델과 결합할 경우 예측 정확도를 향상시키는 데 기여할 수 있음이 다수의 연구에서 확인되었다^[16][17]. 또한 날씨 정보를 단순 입력 변수로 사용하기보다는, 어텐션 메커니즘(Attention Mechanism)이나 데이터 융합 구조를 활용하여 시계열 흐름 내에서 환경 정보의 상대적 중요도를 반영하는 방식도 제안되고 있다^[18][19]. 이러한 방식은 특정 조건(우천, 눈, 강풍 등)에서 트래픽 패턴이 비선형적으로 변하는 현상을 보다 정밀하게 포착할 수 있도록 하며, 모델의 적응성과 일반화 성능 향상에 기여할 수 있다는 결과들은 본 연구에서와 같이 기상 데이터를 기반으로 특정 기상 정보를 선택하거나 또는 순열 기반 중요도를 수행하고, 최적화된 구조를 설계하는 것이 트래픽 예측 정확도 향상에 실질적인 효과가 있을 수 있음을 의미한다.

Table 3.

Summary of the paper on traffic prediction based on environmental information

Ⅲ. 연구 방법 및 실험 설계

정보를 기반으로 데이터 전처리, 변수 선택, 모델 학습 및 성능 평가를 단계적으로 수행한다. RNN, LSTM, GRU 등의 딥러닝 모델을 동일한 조건에서 학습하고, 전통적인 머신러닝 기법과의 비교 및 변수 중요도 분석을 통해 모델의 예측력과 해석 가능성을 종합적으로 검증하였으며, 본 절에서 실험 설계 과정을 항목별로 설명하였다.

1. 데이터 수집 및 전처리

본 연구에서는 한국남동발전에서 제공한 2년간의 실제 네트워크 트래픽 데이터를 기반으로 다변량 시계열 예측을 위한 학습용 데이터셋을 구축하였다. 트래픽 데이터는 SNMP(Simple Network Management Protocol)를 통해 수집되었으며, 하루 단위 최대 트래픽량을 기준으로 처리하였다. 여기에 기상청의 공개 API를 활용하여 해당 날짜의 환경 정보를 결합하였고, 총 7개의 기상 변수(평균 기온, 최저 기온, 최고 기온, 평균 풍속, 최대 풍속, 최대 순간 풍속, 총 일조 시간)를 포함하였다.

수집된 모든 변수는 개별 특성마다 MinMaxScaler를 적용하여 [0, 1] 범위로 정규화하였고, 시계열의 시간성을 보존한 상태로 데이터셋(훈련, 검증, 테스트)을 60:20:20 비율로 분할하였다. 모델의 일반화 성능을 검증하기 위해 각 실험은 동일한 조건에서 5회 반복 수행되었으며, 평균 결과를 성능 지표로 사용하였다.

Fig. 3.

Time Series Prediction Model Training Process Using Traffic and Environmental Data

Fig. 4.

Sample of Traffic and Environmental Data from Korea South-East Power Company(KOEN)

2. 모델 구조 및 설정

본 연구에서는 시계열 데이터의 시간 의존성을 효과적으로 학습할 수 있는 순환 신경망 계열 모델인 RNN, LSTM, GRU를 비교 대상으로 선정하였다. 각 모델은 동일한 구조와 하이퍼파라미터 설정하에 학습되었으며, 다음 표 4와 같이 설정하였다.

Table 4.

Traffic Prediction Model Parameters

모델의 과적합을 방지하기 위해 검증 손실의 개선이 없을 경우 학습을 조기 종료하였으며, 실험 간의 공정성을 확보하기 위해 동일한 네트워크 구조와 초기 설정값을 사용하였다.

3. 비교 모델 및 실험 구성

딥러닝 기반 예측 모델의 효과성을 정량적으로 검증하기 위해, 전통적인 머신러닝 회귀 알고리즘인 Random Forest와 XGBoost를 비교 모델로 설정하였다. 이들 모델은 시계열 내 시간 의존성은 반영하지 못하지만, 다변량 입력에 대한 빠른 학습과 변수 중요도 분석에 강점을 갖는다.

또한, 환경 정보 포함 여부에 따른 성능 차이를 분석하기 위해, 동일한 모델 구조에 대해 (1) 환경 정보가 포함된 조건(Included), (2) 환경 정보가 제외된 조건(Excluded)으로 데이터를 나누어 실험하였다. 추가로, 환경 변수의 중요도 분석을 통해 상관성이 낮은 변수를 제거한 후, 선택된 변수만을 포함한 모델로 재학습을 수행하였다. 실험은 조건별로 5회 반복 수행되었으며, 평균 성능을 기반으로 비교 분석하였다.

4. 성능 평가 지표

모델의 성능 평가는 단일 지표에 의존하지 않고, 다음 표 5와 같이 다중 지표를 활용하여 예측력과 정확도를 종합적으로 평가하였다.

Table 5.

Evaluation Metrics for Prediction Model Performance

또한, 기상 정보가 예측 성능에 얼마나 기여하는지를 정량적으로 분석하기 위해 순열 기반 중요도(Permutation Importance) 기법을 적용하였다. 이 기법은 입력 변수의 값을 무작위로 섞었을 때 손실 함수(MSE)의 변화량을 측정하여, 해당 변수가 모델 성능에 기여하는 정도를 평가한다. 이를 통해 기상 변수들 중 핵심적인 예측 기여 변수를 식별하고, 변수 선택 기반 성능 개선의 가능성을 검토하였다.

Ⅳ. 실험 결과 및 분석

1. 딥러닝 모델 간 성능 비교

먼저, 동일한 실험 조건하에서 RNN, LSTM, GRU 모델을 학습시킨 후, 모델 간 예측 성능 차이를 정량적으로 분석하였다. 본 실험에서는 환경 변수를 배제하고 ‘days’ 변수만을 입력 특성으로 사용하였으며, Epoch 값은 100에서 1,000까지 100단위로 설정하였고, 각 단위별로 Batch Size 7, 14, 21의 조합을 만들어 통해 총 30개의 모델을 구성하고 학습을 진행하였다. 모든 모델은 MSE를 손실 함수로 사용하였고, Adam Optimizer 및 tanh 활성화 함수를 적용하여 실험을 진행하였고, 모델의 성능 평가는 MSE, MAE, RMSE, R², MAPE 등 총 5가지 정량 지표를 기준으로 수행하였으며 그 결과는 표 6과 같다. GRU는 Epoch가 1,000이고 Batch Size가 7인 조건에서 MSE가 3,400.2424로 가장 낮은 값을 나타냈으며, RNN은 Epoch가 800이고 Batch Size가 14일 때 MSE가 750.1932로 우수한 성능을 보였다.

Table 6.

Optimal performance and common condition performance by model (Sorted by MSE)

LSTM은 Epoch가 800, Batch Size가 7인 경우 MSE가 4,226.9909로 가장 낮았다. 위 결과는 전체 모델 중 RNN이 가장 낮은 MSE 값을 기록하여, 동등한 조건하에서 가장 안정적인 예측 성능을 달성했음을 시사한다. 이는 RNN 구조가 단기 시계열 예측에 효과적으로 작용할 수 있음을 보여준다. 표 7에서 보인 것처럼 공통된 실험 조건(Epoch=1,000, Batch Size=7)에서는 RNN이 MSE(1,015.4579), MAE(20.1219)를 기록하며 상대적으로 가장 뛰어난 예측 성능을 보였다. 반면, GRU와 LSTM 모델은 동일 조건에서 각각 MSE(3,400.2424, 5,083.9015)로 상대적으로 높은 예측 오차를 나타냈으며, 이는 구조적 복잡성과 학습 민감도의 차이로 해설될 수 있다. 이와 같은 결과는 RNN 구조가 적은 하이퍼파라미터 설정하에서도 예측 안정성을 유지하는 경향이 있음을 시사하며, 상대적으로 단순한 구조가 오히려 일반화 성능에 유리하게 작용했을 가능성을 확인할 수 있었다.

Table 7.

Optimal performance table for the same parameters of models (Epoch=1,000, Batch Size=7)

2. 전통 머신러닝 모델과의 비교

본 실험에서는 딥러닝 기반 예측 모델과의 성능 비교를 목적으로, 대표적인 전통 머신러닝 기법인 Random Forest와 XGBoost를 동일한 입력 데이터셋에 적용하여 비교 분석을 수행하였다. 실험은 ‘환경 정보 포함’ 및 ‘환경 정보 제외’의 두 조건으로 나뉘어 진행되었으며, 전체 데이터의 20%를 테스트 세트로 분할하여 모델 성능을 평가하였다. 모든 모델은 MSE, RMSE, MAE, R², MAPE의 5가지 평가 지표를 기준으로 성능을 분석하였다.

분석 결과, XGBoost는 대부분의 지표에서 Random Forest보다 우수한 성능을 보였다. 특히 환경 정보를 포함한 조건에서 XGBoost는 MSE 102,721.2, MAE 985.77, RMSE 1,013.42, MAPE 48.04%를 기록하여, 각각 Random Forest의 대응 값인 MSE 103,881.2, MAE 995.92, RMSE 1,019.21, MAPE 48.43%에 비해 낮은 오차율을 나타냈다. 이는 Gradient Boosting 기반의 XGBoost가 복잡한 데이터 패턴에 대해 더 높은 예측 정밀도와 일반화 성능을 제공할 수 있음을 시사한다.

또한, 그림 5와 표 8에서는 Random Forest와 XGBoost 두 모델의 주요 성능 지표(MSE, RMSE, MAE, R², MAPE)를 시각적으로 비교한 결과를 제시하며, 이를 통해 XGBoost가 대부분의 지표에서 Random Forest보다 우수한 예측 정밀도를 보였음을 직관적으로 확인할 수 있다. 다만, 두 모델 모두 환경 정보를 포함한 조건에서 R² 값이 음수로 나타났으며(XGBoost: -25.8248, Random Forest: -26.1277), 이는 예측 결과의 설명력이 평균 예측 기준에도 못 미치는 수준임을 시사한다. 이는 시계열적 패턴의 장기적 의존성과 환경 변수 간 낮은 상관성이 복합적으로 작용한 결과로 해석된다. 한편, 환경 정보를 제외한 실험에서는 일부 지표에서 예측 성능이 향상되었으며, 특히 MAE, RMSE, MAPE 측면에서 오차가 감소하는 경향이 나타났다. 이는 단기 예측에서 환경 정보가 반드시 도움이 되지 않을 수 있으며, 불필요하거나 상관관계가 낮은 변수가 모델 성능을 저하시킬 수 있음을 의미한다. 이러한 결과는 모델의 성능 향상을 위해서는 Feature Engineering이 중요한 역할을 할 수 있음을 의미한다. 이들 모델은 상대적으로 빠른 학습 속도, 높은 해석 가능성, 구조적 단순성을 기반으로 리소스 제약이 있는 환경이나 실시간 응답이 필요한 단기 예측 문제에 적합하게 활용될 수 있다. 그러나 본 연구와 같이 시계열의 장기 패턴 예측이 요구되는 문제에서는 RNN, LSTM, GRU와 같은 딥러닝 기반 모델이 구조적 특성과 학습 능력 측면에서 더 높은 설명력과 예측 정밀도를 제공함을 확인할 수 있었다.

Fig. 5.

Performance metric comparison of traditional machine learning models (Random Forest, XGBoost) using MSE, RMSE, R², MAPE

Table 8.

Performance comparison of traditional machine learning models (Random Forest, XGBoost) for traffic prediction (MSE, RMSE, MAE, R², MAPE)

3. 환경 정보의 성능 기여도 비교

딥러닝 기반 예측 모델에 환경 정보를 무분별하게 포함할 경우, 일부 모델에서는 예측 성능이 오히려 저하되는 현상이 확인되었다. 이는 변수 간 상관관계가 낮거나 다중공선성(Multicollinearity)이 존재할 경우, 모델이 불필요한 패턴까지 학습하게 되어 과적합(Overfitting)으로 이어질 수 있음을 시사한다. 예를 들어, GRU 모델의 경우 환경 정보를 포함했을 때 평균 MSE는 7,009.41에서 1,151.46으로, RMSE는 54.48에서 25.05로, MAE는 82.66에서 18.82로 각각 크게 감소하였다. MAPE 또한 4.41%에서 1.492%로 줄어드는 향상을 보였으나, R²는 0.975에서 0.996으로 상승 폭이 상대적으로 제한적이었다. RNN 모델은 모든 평가 지표에서 환경 정보 포함 시 가장 큰 성능 향상을 나타냈다. 평균 MSE는 2,966.65에서 407.32로, MAE는 51.43에서 13.63으로 줄었으며, R² 값은 0.989에서 0.999로 상승하였다. 이는 RNN 구조가 환경 변수의 시계열적 변화를 효과적으로 학습할 수 있는 특성을 가진다는 점을 뒷받침한다. 반면, LSTM 모델의 경우 평균 MSE는 7,300.25에서 1,394.28로, MAE는 84.65에서 20.84로 감소하며 일부 지표에서 개선되었지만, 평균 R²는 0.974에서 0.995로 개선폭이 제한적이었고, 일부 실험에서는 성능의 불안정성도 관찰되었다. 이는 LSTM이 장기 의존성에는 강점을 지니지만, 단기적인 환경 변수의 영향을 충분히 반영하지 못했을 가능성을 시사한다. 이러한 성능 비교는 표 9에 정리되어 있으며, 모델 구조에 따라 환경 정보의 효과가 다르게 나타난다는 점을 정량적으로 보여준다. 특히 RNN은 환경 정보에 대한 민감도가 높아 성능이 일관되게 향상된 반면, GRU와 LSTM은 일부 지표에서 악화되는 경향도 확인되었다. 이는 환경 정보를 기계적으로 통합하기보다는, 모델 특성과 데이터의 상호작용을 고려한 선택적 변수 활용 전략이 필요함을 강조한다.

Table 9.

Prediction performance comparison of GRU, LSTM, RNN models with and without environmental information (MSE, RMSE, MAE, R², MAPE)

그림 6은 환경 정보 포함 여부에 따른 Epoch 변화에 따른 성능 차이를 시각화한 결과로, 환경 정보를 포함한 모델은 Epoch가 증가할수록 빠르게 수렴하고 MSE가 감소하는 경향을 보였으나, 환경 정보를 제외한 모델은 전체적으로 높은 오차를 유지하며 수렴 속도도 느리게 나타났다. 이는 유효한 환경 정보가 포함될 경우 학습 효율성이 높아질 수 있음을 시사한다.

Fig. 6.

Performance Comparison of GRU, LSTM, RNN Models According to the Inclusion of Environmental Information

한편, 그림 7은 평균기온, 최고기온, 일조시간 등의 환경 변수와 트래픽 최대값 간의 상관관계를 나타낸 히트맵이다. 분석 결과, 기온 계열 변수 간에는 0.90 이상의 높은 상관성이 있었으나, 트래픽 최대값과의 상관계수는 절대값 기준 0.07 이하로 매우 낮았다. 이는 단순 선형 상관관계를 통해서는 트래픽 변화 양상을 설명하기 어려우며, 환경 정보는 비선형 구조나 복합적인 조건에서만 유의미한 영향을 미칠 수 있음을 시사한다. 이에 따라, 예측 기여도가 낮거나 다중공선성이 높은 풍속 계열 변수는 제거하고, ‘Maximum Value’, ‘Average Temperature’, ‘Maximum Temperature’, ‘Total Sunlight Hours’의 4개 핵심 변수만을 선별하여 모델을 재학습하였다.

Fig. 7.

Correlation Heat Map between Environmental Variables and Maximum Traffic

표 10은 핵심 변수만을 포함한 상태에서 GRU, LSTM, RNN 모델에 대해 다양한 Epoch 및 Batch Size 조합에 따른 성능을 정리한 결과이다. 대부분의 경우에서 성능이 크게 개선되었으며, 특히 GRU 모델은 Epoch=700, Batch Size=7 조건에서 MSE 11.95, MAE 2.73으로 가장 우수한 성능을 기록하였다. RNN과 LSTM 또한 비슷한 조건에서 안정적인 예측력을 보였다.

Table 10.

Optimal performance and common condition performance by model (including environmental variables and sorted by MSE criteria)

그림 8은 Epoch 증가에 따른 평균 MSE 변화를 비교한 것으로, 각 실선은 평균 MSE를 나타내며, 주변 음영 영역은 Batch Size에 따른 표준 편차(Standard deviation)를 시각화한 것이다. 이를 통해 핵심 변수만 포함했을 때 환경 정보가 모델 수렴 속도와 성능 안정화에 긍정적인 영향을 미쳤음을 보여준다. Epoch 100~400 구간에서 환경 정보가 포함된 모델은 급격한 성능 향상을 보였으며, 이는 변수의 선별적 통합이 과적합 없이 성능을 극대화할 수 있는 전략임을 의미한다. 특히 세 모델 모두 Epoch=900, Batch Size=14 조건에서 가장 안정적인 성능을 기록하였으며, 이 조건에서의 비교 결과는 표 11에 정리되어 있다. GRU 모델은 MSE 63.08, MAE 5.75로 가장 낮은 오차를 기록하였으며, RNN은 MSE 34.40, MAE 4.42로 더 높은 정밀도를 보였고, LSTM은 상대적으로 높은 오차(MSE 84.62)를 보였지만, 여전히 높은 R² 값을 유지하였다.

Fig. 8.

MSE Comparison by Epoch Depending on the Inclusion of Environmental Variables

Table 11.

Performance Comparison of GRU, LSTM, RNN Models with Environmental Features (Epoch 900, Batch Size 14)

이러한 분석은 환경 정보를 무작정 통합하는 것보다, 변수의 특성과 상관관계 기반의 정제 과정을 거쳐 핵심 정보를 선별적으로 반영하는 것이 딥러닝 모델의 예측 정밀도를 높이고 과적합을 방지하는 데 더욱더 효과적임을 실증적으로 보여준다.

4. 변수 중요도 분석

본 절에서는 RNN, LSTM, GRU 세 모델을 대상으로 환경 변수의 예측 기여도를 정량적으로 분석하기 위해 순열 기반 중요도 기법을 적용하였다. 실험은 동일한 하이퍼파라미터 조건(Epoch=900, Batch Size=14)에서 수행되었으며, 입력 변수로는 ‘Maximum Value’, ‘Average Temperature’, ‘Maximum Temperature’, ‘Total Sunlight Hours’의 총 4가지 환경 정보를 사용하였다. 순열 기반 중요도는 각 변수의 값을 무작위로 섞은 뒤, 해당 조작이 모델 예측 성능(MSE)에 미치는 변화를 측정하는 방식으로, 변수의 상대적 중요도를 평가하는 데 효과적인 방법이다. 변수의 중요도가 높을수록 해당 변수가 예측 성능에 기여하는 비중이 크며, 반대로 중요도가 낮거나 음수인 경우에는 해당 변수가 예측에 기여하지 않거나 오히려 성능을 저해할 수 있음을 의미한다.

그림 9에 나타난 바와 같이, 세 모델 모두에서 평균 기온과 최고 기온은 상대적으로 높은 중요도를 기록하였다. 특히 최고 기온은 RNN과 GRU 모델에서 가장 중요한 변수로 평가되었으며, 이는 두 모델이 온도 계열 변수의 시계열적 변동성을 예측에 효과적으로 반영하고 있음을 시사한다. 반면, GRU 모델에서 Total Sunlight Hours는 거의 기여도가 없는 것으로 나타났으며, 일부 변수는 오히려 중요도 값이 음수로 측정되었다. 이는 해당 변수를 무작위로 섞었을 때 예측 성능이 개선되는 현상이 발생했음을 의미하며, 예측에 방해가 되는 노이즈로 작용했을 가능성을 내포한다. 예를 들어 GRU 모델에서는 days 변수의 중요도가 음수로 나타났으며, 이는 모델의 과적합을 유발할 수 있는 비효율적인 정보로 간주될 수 있다.

Fig. 9.

Permutation Importance Comparison of Environmental Variables across GRU, LSTM, RNN Models

LSTM 모델의 경우, 네 가지 변수 모두에서 중요도 값이 전반적으로 낮은 수준에 머물렀다. 이는 LSTM 구조가 장기 의존성에 집중하는 특성상, 비교적 짧은 기간의 환경 변수 변화(단기적 변동성)를 충분히 활용하지 못했을 가능성을 보여준다. 반면, GRU와 RNN 모델은 일조시간 및 온도 계열 변수에 대해 더 민감하게 반응하는 경향을 보였다.

표 12는 각 환경 변수의 평균 순열 기반 중요도 값을 정리한 것으로, 모델별 예측 민감도 차이를 명확하게 보여준다. 이 표를 기반으로, 예측 기여도가 높은 변수(특히 Average 및 Maximum Temperature)를 중심으로 한 입력 구성 전략이 예측 정밀도 향상에 기여할 수 있음을 확인할 수 있다. 반면, 음수로 측정된 변수는 Feature Engineering의 필요성을 시사한다.

Table 12.

Permutation Importance of Key Environmental Features across GRU, LSTM, RNN Models

이와 같은 변수 중요도 분석은 단순히 환경 정보를 모두 포함하는 방식보다는, 예측 기여도가 높은 핵심 변수만을 선별하여 모델에 반영하는 것이 성능 향상과 과적합 방지에 효과적이라는 점을 강조한다. 따라서 본 결과는 향후 딥러닝 기반 시계열 예측 모델 설계 시 변수 선택 전략 수립에 있어 중요한 참고 자료로 활용될 수 있다.

5. 날짜별 MSE 변화 및 모델 민감도

예측 기간 동안 GRU, LSTM, RNN 세 모델의 일자별 예측 성능을 정량적으로 분석한 결과, 전반적으로 안정적인 예측 결과가 관찰되었으나, 일부 특정 날짜에서는 모든 모델에서 공통적으로 MSE가 급격히 증가하는 이상 구간이 표 13과 같이 확인되었다. 이러한 예외 구간은 주로 2023년 2월 초부터 말까지 집중적으로 나타났으며, 이는 기상 급변, 계절성 요인, 혹은 비정상적인 네트워크 트래픽 증가 등의 외부적 요인이 모델 예측 성능에 직접적인 영향을 미쳤을 가능성을 시사한다. 예를 들어, 2023년 2월 5일에는 GRU 모델에서 약 2,210,774, LSTM은 1,623,349, RNN은 1,507,745의 MSE를 기록하며 예측 오차가 급증하였다. 이처럼 세 모델 모두 유사한 시점에서 높은 오차를 기록한 것은 공통된 외생 변수에 대한 민감한 반응을 보여주는 것으로 해석될 수 있다.

Table 13.

Date and number of abnormal MSE recorded in GRU, LSTM, and RNN models

이 결과는 그림 10에서 시각적으로도 확인될 수 있으며, 그래프 내 빨간 점선으로 강조된 날짜에서 MSE의 급격한 상승이 확인된다. 향후 이러한 이상 구간은 사전 탐지를 통해 예측 시스템의 안정성을 높이기 위한 보완 방향으로 활용될 수 있다.

Fig. 10.

Daily MSE Trends of GRU, LSTM, RNN Models

또한, 모델 학습 과정에서 하이퍼파라미터로 설정된 Epoch 및 Batch Size에 따른 평균 MSE 변화를 분석하였다. 그림 11과 같이, 대부분의 실험에서 Epoch 수가 증가함에 따라 MSE는 전반적으로 감소하는 경향을 보였으며, 이는 딥러닝 모델이 충분한 학습을 통해 예측 오차를 줄이는 일반적인 특성과 일치한다. 그러나 Epoch 수가 일정 수준(약 600 이상)을 초과할 경우, 특히 LSTM 모델에서는 오히려 성능이 저하되는 과적합 현상이 관찰되었다. LSTM 모델은 Epoch 600 전후에서 최소 MSE를 기록하였으나, 이후 Epoch 800~1000 구간에서는 평균 MSE가 다시 증가하는 추세를 보였고, 이는 과도한 반복 학습으로 인해 모델이 훈련 데이터에 과도하게 적응하면서 일반화 성능이 저하되었음을 의미한다. 반면, GRU와 RNN 모델은 Epoch 증가에 따라 비교적 완만한 성능 향상 곡선을 유지하거나, 일정 수준 이상에서는 안정적인 예측 오차를 유지하였다. 이와 같은 경향은 그림 11에 제시되어 있으며, 모델별 Epoch 변화에 따른 MSE의 민감도 차이를 명확히 보여준다. 이러한 결과는 성능 최적화를 위해 단순히 Epoch 수를 증가시키기보다는, 모델의 구조적 특성에 따라 적절한 Epoch 및 Batch Size 설정이 중요하다는 점을 강조한다. 특히 LSTM과 같이 복잡한 메모리 구조를 갖는 모델의 경우, 학습률 스케줄링, 규제화 기법 등을 적극적으로 적용해야 과적합을 방지하고 일반화 성능을 확보할 수 있다.

Fig 11.

MSE Comparison of GRU, LSTM, RNN Models by Epoch

이러한 성능 분석은 모델이 예측에 실패하는 시점들을 조기에 탐지하고, 학습 스케줄을 최적화하기 위한 근거 자료로 활용될 수 있다. 특히 시계열 예측 시스템에서 학습 민감도 분석은 예측 안정성과 실시간 대응력 확보를 위한 핵심 요소임을 본 연구를 통해 실증하였다.

6. 종합 분석

본 연구에서는 실제 네트워크 트래픽과 기상 데이터를 기반으로, 다양한 시계열 예측 모델의 성능을 정량적으로 비교하고 분석하였다. 실험 결과, GRU, LSTM, RNN과 같은 딥러닝 기반 시계열 모델은 Random Forest, XGBoost 등 전통적 머신러닝 모델보다 장기 시점 간의 패턴을 효과적으로 학습함으로써 전반적으로 더 우수한 예측 정확도를 보였다. 이는 시계열 특성을 반영하지 못하는 전통 모델의 구조적 한계와 대조된다. 초기 실험에서는 8개의 기상 환경 정보를 무작정 통합했을 경우, 오히려 MAPE와 R² 지표에서 성능 저하가 발생하는 현상이 관측되었다. 이는 환경 변수 간 낮은 상관관계, 다중공선성 문제 등으로 인해 모델이 불필요하거나 중복된 정보를 학습하게 되었기 때문으로 해석된다. 이러한 한계를 극복하기 위해, 상관관계 분석 기반으로 핵심 변수(Maximum Value, Average Temperature, Maximum Temperature, Total Sunlight Hours)만을 선택한 후 모델을 재학습한 결과, 모든 모델에서 성능이 개선되었으며, 특히 GRU 모델은 가장 낮은 MSE와 MAPE를 기록하였다. 또한 순열 기반 중요도 분석을 통해 모델 구조에 따라 변수에 대한 해석 방식이 다르게 나타남을 확인하였다. 예를 들어 GRU와 RNN은 ‘Total Sunlight Hours’에 민감하게 반응했지만, LSTM은 ‘최저기온’에 대한 중요도가 상대적으로 높게 나타났다. 이는 각 모델의 구조가 입력 변수 처리 방식에 영향을 미친다는 점을 시사하며, 향후 모델 선택 시 변수 특성과 구조적 특성의 정합성이 고려되어야 함을 의미한다.

마지막으로 예측 결과를 날짜별로 분석한 결과 특정 날짜에서 MSE가 급격히 증가하는 현상이 관측되었고, 이는 명절 연휴 직후의 비정상 트래픽, 급격한 기온 변화, 센서 이상 등 외부 환경 요인이 예측 정확도에 큰 영향을 미친다는 점을 보여준다. 이는 시계열 모델이 외부 요인에 민감하게 반응한다는 것을 시사하며, 향후 실시간 이상 탐지 및 네트워크 자율 운용 체계 설계에 유용한 인사이트로 활용될 수 있다.

Ⅴ. 결 론

본 연구는 딥러닝 기반 시계열 예측 모델에 환경 정보를 통합하여 네트워크 트래픽 예측 성능을 향상시키는 방안을 제안하였다. 평균 기온, 최고 기온, 총 일조시간 등의 변수를 GRU, RNN, LSTM 모델에 적용하여 성능 변화를 분석한 결과, 환경 변수의 효과는 모델 구조에 따라 상이하게 나타났다. 특히, 환경 정보를 포함한 조건에서 Epoch=900, Batch Size=14의 설정으로 실험한 결과, RNN 모델이 MSE 34.3964, MAE 4.4220, MAPE 0.3533%, R² 0.9999로 가장 우수한 성능을 기록하였다. GRU와 LSTM 또한 해당 조건에서 안정적인 성능을 보였으나, 과도한 Epoch 설정 시 과적합이 발생할 수 있음을 확인하였다. 순열 기반 중요도 분석을 통해 평균 및 최고 기온이 트래픽 예측에 유의미한 기여가 있었음을 확인하였으며, 일부 변수는 오히려 성능 저해 요인으로 작용하였다. 이러한 결과는 변수 선택의 중요성과 함께, 모델 구조에 따른 최적 학습 조건 설정의 필요성을 강조한다. 본 연구는 환경 정보를 활용한 예측 정밀도 향상 방안을 실증하였으며, 향후 실시간 환경 변수 반영, Transformer 기반 구조 적용, 이상 탐지 기반 사전 경고 시스템과의 연계 가능성을 중심으로 확장 연구가 기대된다.

Acknowledgments

이 논문은 2025년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임 (No.RS-2023-00227431, 3차원 공간 디지털미디어 규격화 기술 개발).

References

S. Chatterjee, “Hyper-connected Living: The Social and Infrastructure Challenges of the Internet of Things,” https://submissions.nobelonline.in/hyper-connected-living-the-social-and-infrastructure-challenges-of-the-internet-of-things/, Feb 1, 2024. [https://doi.org/10.59646/CompComTechC3/119]
L. Liu, D. Essam, and T. Lynar, “Complexity measures for IoT network traffic,” IEEE Internet of Things Journal, Vol.9, No.24, pp.25715–25735, 2022. [https://doi.org/10.1109/JIOT.2022.3197323]
Nokia Bell Labs Consulting, Global Network Traffic Report: Understanding the Growing Impact of Advancing Technologies on Future Networks, Nokia Corporation, CID:213660, 2024. https://www.nokia.com/asset/213660
Y. S. Hussein and A. Al-Jumaily, “Quality of Service (QoS) – Challenges and Solutions,” Unpublished manuscript, 2025. [https://doi.org/10.5772/intechopen.1002087]
O. Aouedi, V. A. Le, K. Piamrat, and Y. Ji, “Deep learning on network traffic prediction: Recent advances, analysis, and future directions,” ACM Computing Surveys, Vol.57, No.6, pp.1–37, 2025. [https://doi.org/10.1145/3703447]
A. H. D. Gunathilake, D. W. Arachchi, and J. Weerasinghe, “In-depth insights into the application of recurrent neural networks in traffic prediction,” Algorithms, Vol.17, No.9, Article No.398, 2024. [https://doi.org/10.3390/a17090398]
F. Kavehmadavani, V. D. Nguyen, T. X. Vu, and S. Chatzinotas, “Intelligent traffic steering in beyond 5G open RAN based on LSTM traffic prediction,” IEEE Transactions on Wireless Communications, Vol.22, No.11, pp.7727–7742, 2023. [https://doi.org/10.1109/TWC.2023.3254903]
X. Qi, J. Yao, P. Wang, T. Shi, Y. Zhang, and X. Zhao, “Combining weather factors to predict traffic flow: A spatial‐temporal fusion graph convolutional network‐based deep learning approach,” IET Intelligent Transport Systems, Vol.18, No.3, pp.528–539, 2024. [https://doi.org/10.1049/itr2.12401]
N. Alqudah and Q. Yaseen, “Machine learning for traffic analysis: a review”, Procedia Computer Science, Vol. 170, pp. 911-916, 2020. [https://doi.org/10.1016/j.procs.2020.03.111]
M. Abumohsen, A. Y. Owda, M. Owda, A. Abumihsan, “Hybrid machine learning model combining of CNN-LSTM-RF for time series forecasting of Solar Power Generation”, e-Prime-Advances in Electrical Engineering, Electronics and Energy, Vol. 9, 2024. [https://doi.org/10.1016/j.prime.2024.100636]
J. Xu, X. Liu, Y. Hu, and J. Zhang, “An intelligent network traffic prediction method based on Butterworth filter and CNN–LSTM,” Electronics, Vol.11, No.2, pp.1–17, 2022. [https://doi.org/10.1016/j.comnet.2024.110172]
R. Zhang, Z. Li, and Y. Liu, “Network traffic prediction model based on linear and nonlinear model combination,” Symmetry, Vol.15, No.1, pp.1–15, 2023. [https://doi.org/10.4218/etrij.2023-0136]
A. Sherstinsky, “Fundamentals of Recurrent Neural Network (RNN) and Long Short-Term Memory (LSTM) network,” Physica D: Nonlinear Phenomena, Vol.404, pp.132306, 2020. [https://doi.org/10.1016/j.physd.2019.132306]
Z. Xu, J. Yuan, L. Yu, G. Wang, and M. Zhu, “Machine learning-based traffic flow prediction and intelligent traffic management,” International Journal of Computer Science and Information Technology, Vol.2, No.1, pp.18–27, 2024. [https://doi.org/10.62051/ijcsit.v2n1.03]
H. Gholami, M. Pourghasemi, M. Tiefenbacher, and D. Tien Bui, “Interpretability of simple RNN and GRU deep learning models used to map land susceptibility to gully erosion,” Science of the Total Environment, Vol.904, 2023. [https://doi.org/10.1016/j.scitotenv.2023.166960]
R. Sharma and P. Singh, “Road Traffic Forecasting Using Air Pollution and Atmospheric Data,” International Journal for Multidisciplinary Research (IJFMR), Vol.6, No.3, pp.45–53, 2024. [https://doi.org/10.1109/ICPECTS62210.2024.10780058]
J. Zhang, Y. Liu, W. Sun, and M. Xu, “Short-Term Traffic Flow Prediction with Weather Conditions Based on Deep Learning Algorithms and Data Fusion,” IEEE Access, Vol.11, pp.12854–12867, 2021. [https://doi.org/10.1155/2021/6662959]
M. Hakim, L. Saeed, and A. Al-Ali, “The Impact of Weather Data on Traffic Flow Prediction Models,” International Journal of Transportation Science and Technology, Vol.12, No.1, pp.22–34, 2023. [https://doi.org/10.11591/ijai.v11.i4.pp1223-1231]
W. Tang, X. Liu, and Y. Chen, “Traffic Flow Prediction under Multiple Adverse Weather Conditions Based on Self-Attention and Deep Learning Models,” Physica A: Statistical Mechanics and its Applications, Vol.631, 2023. [https://doi.org/10.1016/j.physa.2023.128988]

김 정 윤

- 2001년 : 호서대학교 기계학과(공학사)

- 2003년 : 경희대학교 정보통신대학원 정보통신망관리공학과(공학석사)

- 2007년 : 경희대학교 대학원 컴퓨터공학과(박사수료)

- 2024년 ~ 현재 : 경희대학교 컴퓨터공학과 겸임교수

- ORCID : https://orcid.org/0009-0006-4194-7585

- 주관심분야 : 네트워크, 네트워크 보안 및 IoT, 가상화 컴퓨팅, 인공지능

유 인 태

- 1987년 : 연세대학교 전자공학과(공학사)

- 1989년 : 연세대학교 전자공학과(공학석사)

- 1994년 : 연세대학교 전자공학과(공학박사)

- 1997년 : The Univ. of Tokyo 정보통신(Ph.D.)

- 1999년 ~ 현재 : 경희대학교 컴퓨터공학과 교수

- 2007년 ~ 현재 : Cisco Networking Academy 센터장

- ORCID : https://orcid.org/0000-0001-6630-1189

- 주관심분야 : 사이버 보안, 사물인터넷, 인공지능

김 규 헌

- 1989년 2월 : 한양대학교 전자공학과 공학사

- 1992년 9월 : 영국 University of Newcastle upon Tyne 전기전자공학과 공학석사

- 1996년 7월 : 영국 University of Newcastle upon Tyne 전기전자공학과 공학박사

- 1996년 ~ 1997년 : 영국 University of Sheffield, Research Fellow

- 1997년 ~ 2006년 : 한국전자통신연구원 대화형미디어연구팀장

- 2006년 ~ 현재 : 경희대학교 전자정보대학 교수

- ORCID : http://orcid.org/0000-0003-1553-936X

- 주관심분야 : 디지털 방송, 영상처리, 멀티미디어 통신, 디지털 대화형 방송

Problem Definition	Purpose of the Study	Proposed Method	Dataset	Performance Metrics
Lack of technical classification in existing network traffic prediction research^[9].	Systematic organization and classification of machine learning-based traffic prediction techniques.	Comparison and characteristic analysis of ML techniques.	No experimental data.	None
Limitations of existing single LSTM-based prediction performance^[10].	Improving time series prediction accuracy by combining CNN and LSTM.	Comparison with CNN-LSTM hybrid model + RF.	Network load data based on solar power generation.	RMSE, MAPE
High-frequency noise negatively impacts prediction performance^[11].	Application of CNN-LSTM after noise removal using a Butterworth filter.	Prediction with CNN-LSTM after frequency separation.	Network traffic capture data.	MAPE, RMSE
The problem of representing both linear and nonlinear characteristics of traffic with a single model^[12].	Improving prediction accuracy by combining ARMA and ESN.	Predicting the linear part with ARMA and correcting errors with ESN.	Mobile and fixed network traffic data.	RMSE, MAPE, R²

Problem Definition	Purpose of the Study	Proposed Method	Dataset	Performance Metrics
Lack of theoretical explanation for existing RNN and LSTM, and insufficient unified explanation of formulas and training principles^[13].	Intuitive and comprehensive explanation of the operational principles and formula derivation process of RNN and LSTM.	Deriving RNN based on differential equations and mathematically constructing Vanilla LSTM from it.	None	Providing mathematically accurate derivations and structural intuition, and proposing an extended structure for Vanilla LSTM.
Challenges in predicting traffic data with complex temporal and spatial dependencies^[14].	Establishing a foundation for efficient traffic prediction and smart traffic control.	Proposing a multi-view spatiotemporal CNN-based traffic prediction model.	Urban traffic data from the United States.	Experimentally demonstrating that the proposed model outperforms existing models in traffic prediction accuracy.
Difficulty in interpretation due to the black-box problem of DL models^[15].	Utilizing RNN and GRU-based DL models to predict and interpret the spatial risk of gully occurrence.	Application of interpretative techniques such as SHAP, CP-PD, PFI, and Boruta-based variable selection.	Spatial data on gullies in the Shamil-Minab region of Iran.	RNN with KS = 91.6 and GRU with KS = 66.6 demonstrate that RNN is superior, and interpretative techniques allow for analysis of variable influence.

Problem Definition	Purpose of the Study	Proposed Method	Dataset	Performance Metrics
Existing traffic prediction models do not consider environmental factors such as air pollution^[16].	Designing an ML-based traffic prediction model that includes air pollution and weather data.	A regression model including PM2.5, PM10, CO2, NO2, temperature, humidity, etc.	Traffic and environmental sensor data from 2019 to 2023.	Comparison based on accuracy and visualization.
Existing models suffer from performance degradation due to insufficient incorporation of weather factors^[17].	Design of a prediction model integrating traffic and weather data.	Processing traffic with SAE and weather elements with RBF, then combining them.	Twin Cities Highway (Detector 644) in the United States, NOAA weather data.	Comparison of accuracy and combined prediction results.
The impact of weather factors is underestimated in short-term traffic prediction^[18].	Analysis of the effect of adding weather data to models such as LSTM, GRU, and CNN-LSTM.	Comparison of prediction models after integrating PeMS traffic and weather data.	California PeMS traffic and weather data (6 months in 2017).	Accuracy, visualization, PCC (Pearson correlation coefficient).
Degradation of traffic prediction performance under multiple adverse weather conditions^[19].	Design of an integrated model to improve prediction accuracy under conditions of rain, fog, and strong winds.	Integration of a CNN+GRU-based traffic block, a ConvLSTM-based weather block, and Self-Attention.	Traffic and weather data from major urban areas in China.	MAE, RMSE, and time series prediction accuracy.

Item	Value
Model Architecture	2 Recurrent Layers + 1 Dense Output Layer
Learning Rate	0.001
Number of Units	64(1st layer) / 32(2nd layer)
Loss Function	MSE
Activation Function	tanh(recurrent layers), linear(output layer)
Epochs	[100, 200, ..., 1000] (Increments of 100)
Batch Sizes	7, 14, 21
Optimizer	Adam

Metric	Description
MSE(Mean Squared Error)	The mean of the squared differences between predicted and actual values, more sensitive to large errors.
MAE(Mean Absolute Error)	The mean of the absolute differences between predicted and actual values, allowing an intuitive understanding of the average size of the errors.
RMSE(Root Mean Squared Error)	The square root of MSE, in the same units as the actual errors and sensitive to large errors.
R²(Coefficient of Determination)	An indicator of how well the model explains the actual values, with values closer to 1 indicating better performance.
MAPE(Mean Absolute Percentage Error)	Expressing prediction errors as a percentage of actual values, useful for evaluating relative accuracy.

Model	Epoch	Batch Size	MSE	MAE	RMSE	R²	MAPE
GRU	1000	7	3400.2424	39.3429	58.3116	0.9877	3.4573
	1000	21	3648.7084	42.4831	60.4045	0.9868	3.5957
	900	7	3742.4357	42.8401	61.1754	0.9864	3.5617
LSTM	800	7	4226.9909	44.3266	65.0153	0.9847	3.6827
	700	7	4633.5912	49.1277	68.0705	0.9832	4.0554
	1000	7	5083.9015	49.1135	71.3015	0.9816	4.0658
RNN	800	14	750.1932	15.7795	27.3897	0.9973	1.1498
	900	7	805.1577	18.1052	28.3753	0.9971	1.4801
	900	14	1013.5018	20.4919	31.8355	0.9963	1.5526

Model		Random Forest	XGBoost
MSE	Excluded	102057.7	145475.9
MSE	Included	1038812	1027212
MAE	Excluded	285.0514	336.4156
MAE	Included	995.9195	985.7655
RMSE	Excluded	319.4615	373.2294
RMSE	Included	1019.213	1013.422
R²	Excluded	-1.6651	-2.799
R²	Included	-26.1277	-25.8248
MAPE	Excluded	13.6469	16.0512
MAPE	Included	48.4315	48.0049

Model		GRU		RNN		LSTM
Model		Exclude	Include	Exclude	Include	Exclude	Include
MSE	Avg	7009.41	1151.46	2966.65	407.32	7300.25	1394.28
	Max	11409.03	7215.88	7691.91	1849.46	11415.97	7278.73
	Min	3400.24	20.54	750.19	14.204	4226.99	17.371
RMSE	Avg	54.48	25.051	34.75	17.922	55.87	28.053
	Max	69.65	84.946	60.36	43.005	67.92	85.315
	Min	39.26	4.532	15.78	3.769	44.33	4.168
MAE	Avg	82.66	18.821	51.43	13.634	84.65	20.844
	Max	106.81	60.212	87.70	32.908	106.85	61.012
	Min	58.31	3.468	27.39	2.855	65.02	3.029
R²	Avg	0.975	0.996	0.989	0.999	0.974	0.995
	Max	0.988	1.000	0.997	1.000	0.985	1.000
	Min	0.959	0.974	0.972	0.993	0.959	0.974
MAPE	Avg	4.41	1.492	2.64	1.079	4.50	1.701
	Max	5.64	4.958	4.86	2.734	5.42	4.818
	Min	3.46	0.282	1.15	0.216	3.68	0.242

Model	Epoch	Batch Size	MSE	MAE	RMSE	R²	MAPE
GRU	700	7	11.9507	2.7319	3.4570	1.0000	0.2293
	800	21	58.5093	6.0293	7.6491	0.9998	0.4811
	900	14	63.0781	5.7492	7.9422	0.9998	0.4101
LSTM	1000	21	42.9215	5.0487	6.5514	0.9998	0.4123
	800	7	44.3679	5.2155	6.6609	0.9998	0.4370
	1000	7	68.8131	6.1907	8.2954	0.9998	0.4618
RNN	700	14	11.4305	2.6005	3.3809	1.0000	0.2162
	600	21	33.7908	4.5546	5.8130	0.9999	0.3827
	900	14	34.3964	4.4220	5.8648	0.9999	0.3533

Feature	GRU	LSTM	RNN
Average Temperature(°C)	0.007254	0.007209	0.004299
Maximum Temperature(°C)	0.005669	0.006505	0.001829
days	0.00267	0.002333	0.001005
Total Sunlight Hours(hr)	0.002161	-0.00065	-0.00209

Data	GRU	LSTM	RNN
2023-01-08	1,899,269.12	1,445,404.04	1,357,133.95
2023-02-04	2,205,264.68	1,576,198.82	1,499,202.40
2023-02-05	2,210,774.50	1,623,349.45	1,507,744.57
2023-02-20	2,023,276.67	1,489,553.55	1,402,987.75
2023-02-21	2,142,322.52	1,442,900.40	1,364,189.94
2023-02-25	1,969,011.37	1,471,807.68	1,380,693.43
2023-02-26	2,161,102.91	1,602,972.36	1,460,802.18