이 가이드에서는 데이터 수집부터 학습, 결과 확인까지 모든 과정을 쉽게 따라할 수 있도록 설명합니다.
"표 회귀"는 연속적인 값을 예측하는 기술입니다. 주로 수치 예측이 중심이 됩니다.
예를 들어, 결혼 연령에 따른 출산율을 예측하는 경우, 입력 변수로 결혼 연령을 사용하고 출력 변수로 출산율을 예측할 수 있습니다.
원인 데이터: 모델이 학습에 사용하는 데이터로, 예를 들어 결혼 연령 같은 데이터를 입력 데이터로 사용할 수 있습니다.
결과 데이터: 모델이 예측하려는 목표 값으로, 예를 들어 출산율이 결과 데이터로 사용될 수 있습니다.
이 과정을 통해 데이터와 결과 간의 관계를 파악하고, 새로운 데이터가 들어왔을 때 AI가 어떤 결과를 예측할 수 있는지 학습하게 됩니다.
페이지 상단에 표 분류 기능을 설명하는 제목이 표시됩니다.
업로된 파일명이 표시됩니다.
예: 결혼 연령에 따른 출산율.xlsx엑셀에서 작업한 내용을 표로 업로드 할 수 있습니다.
표에서 작업한 내용을 엑셀 파일로 다운로드 받을 수 있습니다.
열 추가, 삭제 버튼 클릭시 원인 표, 결과 표의 열이 추가 되거나 삭제 됩니다.
행 추가, 삭제 버튼 클릭시 해당 표의 행이 추가 되거나 삭제 됩니다.
원인 표는 입력 데이터를 보여줍니다.
결과 표는 출력 데이터를 보여줍니다.
AI 모델을 학습시키는 버튼입니다.
학습 과정에서 필요한 다양한 설정(예: 학습 횟수, 학습률 등)을 조정할 수 있는 영역입니다.
표 회귀는 예측하려는 목표 값(출산율, 가격 등)을 기반으로 한 실제 데이터를 사용해야 합니다.
표 분류와 다르게, 학습과 예측의 정확도를 높이기 위해 외부 데이터를 수집하는 것이 중요합니다.
표 회귀에서는 원인 데이터와 결과 데이터 사이의 관계를 학습하여 예측합니다.
여기에서 원인 데이터와 결과 데이터의 관계를 이해하는 것은 매우 중요하며, 아래는 결혼 연령과 출산율 데이터를 예시로 들어 관계성을 설명해보겠습니다.
원인 데이터는 모델이 학습하는 입력 데이터로, 결과 데이터(출산율)에 영향을 미칠 수 있는 요소들을 포함합니다.
결과 데이터는 모델이 예측하려는 값으로, 원인 데이터와 밀접한 관계를 가집니다.
가정 1: 결혼 연령이 높아지면 출산율이 감소한다
가정 2: 연도별로 사회적 변화가 출산율에 영향을 미친다
가정 3: 결혼 연령 평균(남/여)이 출산율에 비례적으로 영향을 미친다
결혼 연령과 출산율의 관계는 단순히 가정으로 끝나는 것이 아니라, 데이터를 기반으로 모델이 학습하여 더 정확한 관계를 찾아냅니다.
표 회귀는 숫자 값의 패턴을 학습하여 결과를 예측합니다.
따라서 신뢰할 수 있는 실제 데이터를 사용해야 모델이 올바른 학습을 할 수 있습니다.
이 데이터는 외부 API나 공공 데이터 포털 등에서 얻을 수 있습니다.
아래는 표 회귀 모델에 필요한 데이터를 수집할 수 있는 참고 사이트들입니다.
날씨 데이터를 활용한 모델
주식 데이터를 활용한 모델
농산물 데이터를 활용한 모델
출산율 데이터를 활용한 모델
엑셀에 입력할 때는 다음과 같은 규칙을 따라야 합니다
시트 구성
데이터 형식
원인 시트
결과 시트
파일 업로드
사용자가 제공한 데이터를 기반으로 AI 모델이 학습하여 결과를 예측하는 과정입니다.
학습 과정은 자동으로 이루어지며, 사용자는 결과만 확인하면 됩니다.
학습하기 버튼을 누르면 학습이 시작되면 상단에 학습 진행률을 나타내는 그래프 바가 표시됩니다.
입력한 데이터 전체를 몇 번 반복하여 학습할지 정하는 부분입니다. 예를들어 학습 횟수가 10일 경우, 전체 데이터를 10번 반복하여 학습합니다. 많이 학습할 수록 더 정확한 모델을 만들 수 있지만, 학습 시간이 오래 걸립니다. 또한 학습 횟수가 많을수록 과적합(Overfitting)이 발생하여 오히려 안좋은 모델이 생성 될 수 있습니다.
입력한 데이터 전체를 얼마큼 작은 부분으로 쪼개서 학습할지 정하는 부분입니다. 예를들어 전체 데이터가 1000개이고 배치 크기가 100일 경우, 한번에 100개의 데이터로 학습하게 됩니다. 배치크기가 작을수록 모델이 더 자주 학습하게 됩니다. 배치크기가 클수록 메모리 사용량이 올라가며, 일반적으로 1~1024의 배치 크기를 사용합니다.
AI 모델을 얼마나 빠르게 학습할지 정하는 부분입니다. 학습률이 너무 높으면 학습이 빠르게 진행되지만, 최적의 값을 찾지 못할 수 있습니다. 학습률이 너무 낮으면 학습이 느리게 진행되지만, 최적의 값을 찾을 수 있습니다.
결과 UI를 보려면 학습하기 버튼을 클릭하세요.
페이지 상단에 학습된 모델의 이름이 표시됩니다.
입력한 데이터는 AI 모델의 예측 결과를 생성하는 데 사용됩니다.
학습된 AI 모델의 예측 결과를 보여줍니다.
학습된 AI 모델 파일을 다운로드할 수 있습니다.
다운로드한 파일은 오프라인 환경에서도 AI 모델을 실행하거나 분석하는 데 사용할 수 있습니다.