📘 시계열 사용 설명서

이 가이드에서는 데이터 수집부터 학습, 결과 확인까지 모든 과정을 쉽게 따라할 수 있도록 설명합니다.

🖼️ 시계열 콘텐츠 소개

시계열은 시간의 흐름에 따라 변화하는 데이터를 활용하여, 미래의 추세나 특정 값(수요, 매출, 에너지 사용량 등)을 예측할 수 있게 해주는 기능입니다.

일상 속에서도 시계열 데이터는 매우 자주 사용됩니다. 예를 들어, 평균기온 예측을 통해 미래 날씨를 예측하는 것은 다음과 같은 데이터로 이루어집니다.

활용 사례: 농작물 재배 계획, 에너지 사용량 예측, 방한 상품 마케팅 전략 등

입력 데이터: 특정 지역의 과거 일별 평균기온(날짜와 함께 기록 예: 날짜: 2023-01, 평균기온: 2°C), 최고기온, 최저기온 등

학습 결과: 이 모델은 모든 행 데이터를 활용하여 항상 두번째 행(평균기온)의 미래 값을 예측합니다.

즉, 아래 예제에서는 과거 n일간의 모든 행 데이터(평균기온, 최고기온, 최저기온)를 활용하여 특정 날짜 이후 n일간의 두번째 행 데이터(평균기온)을 예측합니다.

🖥️ UI 컴포넌트 구성 소개

데이터를 수집하고 학습하기 버튼을 클릭하면 나만의 AI 모델이 만들어집니다.
국가통계포털 KOSIS 참고

제목

페이지 상단에 시계열 기능을 설명하는 제목이 표시됩니다.

파일명

업로된 파일명이 표시됩니다.

예: 평균기온 예측.xlsx

엑셀 파일 업로드

엑셀에서 작업한 내용을 표로 업로드 할 수 있습니다.

엑셀 파일 다운로드

표에서 작업한 내용을 엑셀 파일로 다운로드 받을 수 있습니다.

열 추가, 삭제

열 추가, 삭제 버튼 클릭시 표의 열이 추가 되거나 삭제 됩니다.

행 추가, 삭제

행 추가, 삭제 버튼 클릭시 표의 행이 추가 되거나 삭제 됩니다.

표는 입력 데이터를 보여줍니다.

학습하기

AI 모델을 학습시키는 버튼입니다.

학습 설정

학습 과정에서 필요한 다양한 설정(예: 과거데이터 개수, 예측데이터 개수 등)을 조정할 수 있는 영역입니다.

📸 수집하기

시계열 데이터는 시간 정보와 타겟 데이터(예측하려는 값)로 구성됩니다.

예제에서는 평균기온 예측을 목표로 데이터를 준비합니다.

필수 데이터

시간 열: 시간 정보를 포함한 열입니다. 연/월 형식(YYYY-MM)이나 연(YYYY) 형식을 사용할 수 있습니다. 시간 열은 아래로 갈 수록 최근 데이터가 위치하도록 정렬합니다.

타겟 열: 예측하려는 값입니다. 예를 들어 평균기온, 매출, 에너지 소비량 등이 해당됩니다. 항상 두번째 행에 위치해야 합니다.

추가 데이터

보조 열: 분석 및 예측 정확도를 높이기 위해예측에 사용되는 데이터 값입니다. 항상 세번째 행 이후에 위치해야 합니다. 기온 예측을 예로들면 최고기온, 최저기온 등이 해당됩니다. 혹은 에너지 소비량을 예로들면 요일, 기온, 날씨 등이 해당됩니다.

작성 시 유의사항

시간 열(예: 월별날짜)은 일관된 포맷으로 작성합니다.

  • 월 단위 데이터를 사용할 경우 YYYY-MM 형식을 권장합니다.
  • 연 단위 데이터를 사용할 경우 YYYY 형식을 사용합니다.

타겟 열(예: 평균기온)에는 예측하려는 값을 입력합니다.

보조 열(예: 최고기온, 최저기온)은 모델 학습에 추가 정보를 제공할 수 있지만, 필수는 아닙니다.

외부 데이터

국가통계포털 (KOSIS)

국내 통계 데이터를 가장 광범위하게 제공하는 사이트로, 경제, 기후, 인구, 산업 등 다양한 분야의 데이터를 제공합니다.

기상청 (KMA)

국내 날씨와 관련된 상세 데이터를 제공하며, 기온, 강수량, 바람 등 기상 데이터를 얻을 수 있습니다.

📚 학습하기

사용자가 제공한 데이터를 기반으로 AI 모델이 학습하여 결과를 예측하는 과정입니다.

학습 과정은 자동으로 이루어지며, 사용자는 결과만 확인하면 됩니다.

학습하기

학습하기 버튼을 누르면 학습이 시작되면 상단에 학습 진행률을 나타내는 그래프 바가 표시됩니다.

학습 설정

과거데이터 개수(SizeInput)

모델에 입력으로 들어가는 과거 데이터의 개수를 의미합니다. 예를들어 5라면 과거 5일간의 데이터가 모델에 입력으로 들어가게 됩니다. 이 값이 커질수록 메모리가 많이 필요하고 학습이 오래 걸리지만, 더 많은 과거 데이터를 참고할 수 있게 됩니다.

예측데이터 개수(SizeOutput)

모델에서 출력으로 나오는 예측된 미래 데이터의 개수를 의미합니다. 예를들어 10이라면 미래 10일간의 데이터를 예측하게 됩니다. 이 값이 커질수록 메모리가 많이 필요하고 학습이 오래 걸리지만, 더 먼 미래를 예측할 수 있게 됩니다.

학습 횟수 (Epoch)

입력한 데이터 전체를 몇 번 반복하여 학습할지 정하는 부분입니다. 예를들어 학습 횟수가 10일 경우, 전체 데이터를 10번 반복하여 학습합니다. 많이 학습할 수록 더 정확한 모델을 만들 수 있지만, 학습 시간이 오래 걸립니다. 또한 학습 횟수가 많을수록 과적합(Overfitting)이 발생하여 오히려 안좋은 모델이 생성 될 수 있습니다.

배치 크기 (Batch Size)

입력한 데이터 전체를 얼마큼 작은 부분으로 쪼개서 학습할지 정하는 부분입니다. 예를들어 전체 데이터가 1000개이고 배치 크기가 100일 경우, 한번에 100개의 데이터로 학습하게 됩니다. 배치크기가 작을수록 모델이 더 자주 학습하게 됩니다. 배치크기가 클수록 메모리 사용량이 올라가며, 일반적으로 1~1024의 배치 크기를 사용합니다.

학습률 (Learning Rate)

AI 모델을 얼마나 빠르게 학습할지 정하는 부분입니다. 학습률이 너무 높으면 학습이 빠르게 진행되지만, 최적의 값을 찾지 못할 수 있습니다. 학습률이 너무 낮으면 학습이 느리게 진행되지만, 최적의 값을 찾을 수 있습니다.

📈 결과보기

결과 UI를 보려면 학습하기 버튼을 클릭하세요.

학습 모델명

페이지 상단에 학습된 모델의 이름이 표시됩니다.

그래프

학습된 모델의 예측 결과와 실제 데이터를 시각적으로 확인할 수 있습니다.

과거값과 예상값이 같은 그래프 위에 겹쳐 있어, 모델의 예측이 얼마나 정확한지 시각적으로 확인할 수 있습니다.

과거값

실제로 수집된 데이터로, 과거 시간의 평균기온 값을 나타냅니다. 하늘색 선으로 표시됩니다.

예상값

학습된 모델이 예측한 미래 평균기온 값을 나타냅니다. 파란색 선으로 표시됩니다.

그래프의 파란색 선(예상값)을 클릭하면 선택한 시점 이후의 예측 데이터가 더 상세하게 나타납니다.

그래프의 구조

X축: 시간(월별 날짜 등)

Y축: 평균기온(°C)