안녕하세요. 원클릭 에이아이 대표 오승영입니다.
지난 글(Part 1)에 이어, 이번 글에서는 원클릭 에이아이 플랫폼을 활용한 Part 2 활동을 소개해 드리려고 합니다.
이번 단계에서 학생들은 아이디어부터 데이터까지 직접 수집해서 AI 모델을 만들어 보는 경험을 했습니다.
실제로 AI를 제대로 이해하려면, 단순히 “모델을 돌려 본다”에서 끝나는 것이 아니라, 데이터를 직접 들여다보고 “왜 이렇게 학습이 됐는지”를 해석하는 과정이 필수적입니다.
예를 들어, 이상한 결과가 나왔다면 모델 구조나 하이퍼파라미터 문제일 수도 있지만, 실제로는 데이터에 문제가 있는 경우가 훨씬 더 많습니다.
혹은, 데이터와 학습에는 문제가 없는데, 결과 자체가 우리가 처음에 예상하지 못했던 방향으로 나오는 경우도 있습니다. 이런 과정을 겪어 보면서 학생들은 “AI가 왜 이렇게 행동했는지”를 고민해 보게 됩니다.
데이터 선택: 이미지 vs 표
이번 활동에서 학생들은
“이미지 데이터”, “표 형태 데이터” 중 하나를 선택해 데이터를 수집했습니다.
이미지 데이터의 경우, 구글 이미지 검색 등을 활용해 데이터를 모으는 경우가 많았고, 표 데이터는 국가통계포털(KOSIS) 같은 곳에서 공공 데이터를 가져와 활용했습니다. 또한, Kaggle과 같은 데이터셋 플랫폼에서 직접 주제에 맞는 데이터를 찾기도 했습니다.
결국 핵심은,
“내가 세운 가설을 검증할 수 있는 데이터를 직접 찾아보고,
그 안에 어떤 패턴이 숨어 있는지 발견해 보는 것”
이 과정 자체가 가장 중요한 학습 목표였습니다.
그럼, 이런 과정을 통해 학생들이 실제로 어떤 프로젝트를 진행했는지 함께 보도록 하겠습니다.
트롤링에 대한 고찰
진정한 트롤이란 무엇인가
이 조는 유명 게임인 **리그 오브 레전드(LoL)**에서 함께 게임하는 팀원이 “트롤인지 아닌지”를 판별하는, 말 그대로 “트롤 배심원” 역할을 하는 AI 모델을 기획했습니다.
이들은
- 게임 내 전적 데이터,
- 채팅 로그,
- 포지션/라인 정보,
- 플레이 패턴
- 등 다양한 정보를 종합해 판단해야 한다고 보고,
- 여러 종류의 데이터를 동시에 입력으로 받는 멀티모달 구조가 필요하다고 스스로 분석했습니다.
아쉽게도 이번 캠프에서 사용한 플랫폼은 이런 멀티모달 구조를 지원하지 않아서, 아이디어와 데이터 수집 단계까지 진행하고 마무리하게 되었습니다. 하지만, 저는 이 팀이 보여준 과정만으로도 교육적으로 훌륭했다고 생각합니다.
“AI에게 어떤 정보가 필요할까?”, “이 데이터들은 왜 중요하고, 서로 어떤 상관관계가 있을까?”를 고민해 보는 것 자체가 이미 큰 성장의 시작이기 때문입니다.
특히, 학생들이 본인의 관심사(게임)에서 출발해 재미있는 문제를 진지한 문제 정의와 데이터 설계로 이어간 것이 인상적인이 팀이었습니다.


AI 활용 미세먼지 예측 프로그램
내일의 공기는 안녕한가요
이 조는 과거의 미세먼지 농도 데이터를 기반으로, 앞으로 일정 기간의 미세먼지 농도를 예측하는 AI 모델을 만들었습니다. 미세먼지는 그 이름처럼 입자 크기가 매우 작아서 일반 마스크로도 완전히 막기 어렵다는 이야기가 많습니다. 결국 가장 좋은 방법은 “미리 농도를 예측해서 외부 활동을 조절하는 것”이겠죠.
이 팀은 자기 자신의 과거 데이터만을 사용해 미래를 예측하는 자기상관(auto-correlation) 방식의 아이디어를 적용했습니다. 즉, 다른 외부 변수를 따로 넣지 않고, 미세먼지 농도 자체의 계절성, 추세(트렌드)가 유의미하다고 보고 그 패턴을 활용한 것입니다.
신뢰할 만한 데이터를 얻기 위해 국가통계포털 KOSIS에서 과거 3년치 데이터를 가져와 분석했고, 이를 기반으로 예측 모델을 만들어 나름 의미 있는 결과를 도출해 냈습니다.
전반적으로
- 문제 정의 → 데이터 수집 → 분석 → 모델링
- 으로 이어지는 흐름이 아주 깔끔했고,
- 팀워크도 좋아 보였던 팀이었습니다.
짧은 시간이었지만, 개인적으로 하나만 더 추가하자면, 날씨(기온, 습도, 풍속 등) 데이터를 함께 넣었으면 더 정교한 모델이 될 수 있었겠다는 생각이 들었습니다. (이건 고등학생이 아니라, 학부 과제로 가도 손색 없을 정도의 아이디어였어요.)


물고기의 생김새에 따른 특징과 그 이용
니가 사는 그 집, 그 집이 내 집이었어..야 할까?
개인적으로 가장 관심이 갔던 아이디어였습니다. AI를 만들다 보면, 이미지 쪽에서는 늘 “개 vs 고양이 분류”, “MNIST 숫자 인식” 같은 비슷한 예시를 반복해서 보게 됩니다. 그래서 “나만의 주제”를 찾는 것이 생각보다 정말 어렵습니다. 그런 면에서 이 조는 특히 눈에 띄었습니다.
이 팀은 물고기의 특정 부위만 보고, 그 물고기가 어디에 사는지(서식지)를 추정하는 모델을 만들었습니다. 마치, 자동차의 일부분만 보고 어떤 차인지 맞히는 “자동차 신동” 같은 느낌의 모델이었어요. 놀랍게도, 물고기는 서식지에 따라 입, 지느러미, 꼬리 등의 생김새가 조금씩 다르게 나타납니다. 따라서 특정 부위의 이미지 정보만 가지고도 서식지를 어느 정도 유추하는 것이 가능하다는 점에 착안한 아이디어였습니다.
이 조는 가능한 한 많은 이미지를 수집해 이를 학습 데이터와 테스트 데이터로 나누어 모델을 학습·검증했고, 꽤 준수한 정확도를 보여 주었습니다. “어디서 본 적 없는, 정말 자기들만의 주제”를 끝까지 밀어붙였다는 점에서 콘셉트와 실행력 모두 강렬했던 팀이었습니다.


영양소별 소화제 추천
오늘 먹은 메뉴에 딱 맞는 AI 소화제 약사
이 조는 직전에 섭취한 음식을 바탕으로 소화제를 추천하는, 정말 흥미로운 아이디어를 제시했습니다. 저도 잘 몰랐던 분야라, “아, 이런 식의 아이디어도 가능하구나” 하는 걸 이번에 처음 알게 되었습니다.
아이디어의 핵심은 이렇습니다.
섭취한 음식의 탄수화물·단백질·지방 비율에 따라 필요한 분해 효소의 양을 계산한 뒤, 각 소화제에 담긴 소화 효소의 비율과 비교해서 가장 잘 맞는 소화제를 찾는 방식입니다.
조금 더 풀어서 설명하자면,
- 학생들이 섭취한 음식의 탄수화물–단백질–지방 비율을 구하고,
- 각 소화제에 함유된 영양소 분해 효소 비율을 가져온 다음,
- 음식의 영양비와 소화제의 효소비 간의 차이를 구해 그 차이의 절댓값을 계산합니다.
- 이 절댓값이 가장 작은 소화제를, 가장 적합한 제품으로 수치화해서 추천하는 구조입니다.
즉, 이미 수식으로 어느 정도 표현할 수 있는 과정을, AI 모델로 대체·일반화하는 접근이라고 볼 수 있습니다. 이런 방식은 저도 예전에 Physics-Informed Neural Network(PINN) 같은, 물리 법칙이나 수식을 신경망에 녹여 넣는 기법을 공부하면서 접한 적이 있는데요, 벌써부터 이런 아이디어를 떠올리고 실제로 적용해 보려는 시도 자체가 정말 기특합니다.
결과적으로, 섭취한 음식의 영양 비율만 알려주면 적절한 소화제를 자동으로 추천해 주는 AI 모델을 만들어 낸 셈입니다. 아이디어·수학·실제 생활 응용까지 잘 연결한, 인상적인 프로젝트였습니다.


그 밖에 소개하지 못한 팀들
마지막으로, 여기에는 사진으로 다 담지 못했지만, 다른 팀들도 아주 인상적인 프로젝트를 많이 해주었습니다.
예를 들면,
- 토마토의 병충해를 이미지 분류로 구분하는 모델,
- 모기의 개체 수를 시계열 데이터로 예측하는 모델
등이 있었고, 모든 팀이 끝까지 포기하지 않고 PPT 자료와 발표까지 잘 마무리해 주었습니다.
모든 팀에게 “정말 수고 많았고, 여러분이 만든 프로젝트는 전부 다 의미 있었다” 라고 꼭 전해주고 싶습니다.
