이 가이드에서는 데이터 수집부터 학습, 결과 확인까지 모든 과정을 쉽게 따라할 수 있도록 설명합니다.
군집화2D는 X축(키)와 Y축(몸무게)처럼 두 가지 수치형 변수를 이용해 군집화한 뒤, 결과를 2D 좌표평면에 표시해주는 기능입니다.
군집화와 유사하지만, 2차원 데이터(X축, Y축)를 시각화한다는 점이 특징입니다.
페이지 상단에 시계열 기능을 설명하는 제목이 표시됩니다.
업로된 파일명이 표시됩니다.
예: 운동선수 체중.xlsx엑셀에서 작업한 내용을 표로 업로드 할 수 있습니다.
표에서 작업한 내용을 엑셀 파일로 다운로드 받을 수 있습니다.
행 추가, 삭제 버튼 클릭시 표의 행이 추가 되거나 삭제 됩니다.
표는 입력 데이터를 보여줍니다.
AI 모델을 학습시키는 버튼입니다.
학습 과정에서 필요한 다양한 설정(예: 학습 횟수, 학습률 등)을 조정할 수 있는 영역입니다.
2차원(2D)으로 군집화하려면, 두 개의 숫자형(수치형) 정보를 골라 X축과 Y축으로 삼아야 한다는 점이 가장 중요합니다.
평면(2D)에 데이터를 찍으면, 눈으로 직접 보면서 어느 그룹에 속하는지 쉽게 이해할 수 있어요.
예:
예: 키(cm)와 몸무게(kg)
예: 나이(세)와 한 달 지출(원)
예: 공부시간(시간)과 시험점수(점)
이처럼 의미 있는 두 숫자를 정해야, 군집화해서 뽑아낼 결과가 유용해집니다.
군집화는 데이터가 여러 개 있어야 의미가 큽니다.
최소한 20개 이상(가능하면 더 많은) 자료를 모아보세요.
군집화하면, 비슷한 체격을 가진 친구들끼리 그룹 지어볼 수 있어요.
체격별로 어떤 운동을 추천하면 좋을지 아이디어를 얻을 수 있습니다.
나이가 많을수록 용돈(또는 지출액)도 많아지는지?
군집화로 "비슷한 나이·비슷한 지출"의 학생들을 묶을 수 있습니다.
사용자가 제공한 데이터를 기반으로 AI 모델이 학습하여 결과를 예측하는 과정입니다.
학습 과정은 자동으로 이루어지며, 사용자는 결과만 확인하면 됩니다.
학습하기 버튼을 누르면 학습이 시작되면 상단에 학습 진행률을 나타내는 그래프 바가 표시됩니다.
모델이 데이터를 반복 학습하는 횟수입니다.
한 번에 처리할 데이터의 개수를 설정합니다.
학습 속도를 제어하는 값입니다.
결과 UI를 보려면 UI 컴포넌트 구성 소개 학습하기 버튼을 클릭하세요.
페이지 상단에 학습된 모델의 이름이 표시됩니다.
입력한 데이터는 AI 모델의 예측 결과를 생성하는 데 사용됩니다.
그래프 각 점(동그라미)이 한 명의 데이터(예: 한 명의 선수)를 나타냅니다.
그래프의 가로축(X축)은 키, 세로축(Y축)은 몸무게처럼, 내가 미리 정해둔 두 개의 수치가 배치됩니다.
점마다 색깔이 다른데, 이 색깔이 같은 무리(그룹)에 속해 있습니다.
오른쪽으로 갈수록 키가 크다는 의미 (X축 값이 커짐)
위로 갈수록 몸무게가 많다는 의미 (Y축 값이 커짐).
예: 하늘색, 보라색, 회색 등으로 구분됩니다.
같은 색깔이면 비슷한 키,몸무게를 가진 무리(그룹)에 속해 있습니다.
그래프에 유난히 크거나 진하게 표시된 점이 있을 수 있는데, 그 무리(그룹)에 속한 사람들의 평균 키와 평균 몸무게를 나타냅니다.
그 평균 점 근처에 있는 사람들은 그 그룹의 전형적인(대표적인) 특성을 갖고 있다고 볼 수 있습니다.
하늘색 그룹: 대체로 키도 크고, 몸무게도 꽤 나가는 사람들 → 평균 키 185cm, 평균 몸무게 90kg 정도
보라색 그룹: 키가 조금 작고(175~180cm), 몸무게가 가벼운 사람들 → 평균 키 178cm, 평균 몸무게 70kg 정도
회색 그룹: 키가 아주 크거나, 몸무게가 아주 무겁거나 가벼운 극단적인 경우가 모였을 수도 있음
이처럼 색깔별 그룹을 보고, "어떤 특징이 있지?", "왜 여기서 나뉘었지?"를 생각해볼 수 있습니다.
점들이 서로 가깝게 모여 있으면, 키·몸무게가 서로 비슷하다는 뜻 입니다.
그걸 아웃라이어(이상치)라고도 부르지만, "학생들은 특이 케이스!" 정도로 이해하면 됩니다.
그래프 위에 표시된 그룹 평균을 보면, 각 그룹 평균 키와 몸무게가 어느 정도인지 한눈에 파악할 수 있습니다.
"어느 그룹이 가장 키가 크고, 어떤 그룹이 몸무게가 가장 낮지?" 같이 쉽게 비교할 수 있습니다.