지난 6월 14일 연세대학교 백양누리관에서 열린 <데이터야놀자 2025> 행사에 다녀왔다.
사실 행사에 가기 전까지만 해도 ‘과연 나에게 얼마나 도움이 되는 자리일까?’ 하는 고민도 있었다.
하지만 결론부터 말하자면, 정말 잘 다녀왔다는 마음으로 돌아왔다.
이번 후기는 당시 들었던 여러 세션 중 인상 깊었던 발표 내용들,
그리고 그를 통해 어떤 고민과 깨달음을 얻었는지를 중심으로 기록해 보려 한다.
그래서 꽤나 긴 글이 될 수 있을 것 같다.
본 글에 담긴 강연 내용은 현장에서 들은 내용을 바탕으로 개인의 기억과 해석에 따라 정리한 것으로, 실제 발표 내용과는 다소 차이가 있을 수 있습니다.
데이터야놀자는 Jazz, Rock, Classic이라는 세 가지 세션 트랙으로 구성되어 있었고,
각 타임별로 듣고 싶은 강의실을 자유롭게 오가며 들을 수 있는 형식이었다.
스탬프 투어, 굿즈 이벤트, 휴식과 네트워킹 라운지도 준비해 놓아 여러 기업과 커뮤니티 모두 행사 준비에 공을 들인 것이 느껴졌다.
🎙️ 노코드로 데이터 분석, 진짜 가능한가요?
현재 데이터 분석 교육을 받고 있는 입장에서 “노코드로 분석이 가능하다고?” 하는 궁금증으로 들어간 첫 세션이었다.
다만 발표는 '노코드의 구현 방식'보다는 AutoML 오픈소스를 활용한 솔루션 기능 소개에 가까웠다.
내가 기대했던 것과는 살짝 결이 달랐지만, AutoGloun, FLAML, H2O 등 다양한 도구를 통해 지금 일일이 시행하고 있는 전체 분석 과정을 클릭 몇 번으로도 가능하게 하는 때가 다가오고 있다는 점을 실감했다.
(지금도 이미 다양한 시각화, 분석 툴이 존재하고 많이 사용되고 있지만..)
개인적으로 인상 깊었던 건 발표자가 이 솔루션을 만들게 된 동기였다.
" 단계별 구현보다, 데이터 분석의 본질에 집중할 수 있으면 좋겠다. "
데이터 분석의 핵심은 결국 ‘인사이트’를 찾아내는 데 있다.
그런데 구현에 집중하다 보면 오히려 그 본질을 놓치는 경우가 많다는 것에 공감했다.
데싸4기 과정을 따라가며 데이터톤을 경험하기 전까지는 코드를 따라 치는 데 급급했고,
데이터 자체를 어떻게 보고 활용할 것인가에 대한 고민은 부족했던 터라 더 와닿았다.
이번 발표를 들으며 '그럼 데이터의 구조가 완전히 다를 때는? 시계열 같은 데이터도 가능한가? 실시간성으로도 가능할까?' 등 또 기술에 대한 여러 궁금증이 있기도 했다.
하지만 그보다 더 중요한 건 결국 기술 구현 자체보다는 ‘내가 무엇을 알고 싶은가’를 먼저 정의하고,
거기에 맞게 전체 흐름을 설계하고 실행할 수 있는 능력이라는 것을 생각하게 되는 요즘이다.
데이터 분석을 하고 싶은 사람의 입장으로서!
모델러, 데이터 엔지니어 등 기술 구현이 목표인 사람에게는 기술의 완성도가 우선적인 목표일 테니, 각자의 목표를 잘 설정하는 것이 중요하다고 생각한다.
🎙️ 로그 데이터로 사용자 이탈 뜯어보기: 행동 단위로 퍼널을 만들어본 PM의 분석기
‘어떤 로그 데이터를 활용하고 어떤 기준으로 사용자 이탈을 분석했을까?’
‘퍼널은 어떻게 정의했을까?’
궁금한 마음으로 들어간 세션이었다.
사용자의 입력 폼이 많은 서비스의 사례였는데,
사용자마다 입력과 이탈 흐름이 워낙 다양하다 보니 단순한 퍼널 정의로는 이탈 요인을 파악하기 어려웠다고 한다.
그래서 발표자 분은 프로세스 마이닝이라는 분석 방법을 사용해 흐름을 정리했다.
프로세스 마이닝은 이벤트 로그 데이터에 특수 알고리즘을 적용하여 프로세스가 어떻게 전개되는지에 대한 추세, 패턴 및 세부 정보를 식별하는 방법
[출처] https://www.ibm.com/kr-ko/topics/process-mining
분석은 대략 이런 흐름으로 진행되었다:
- 로그 데이터 구조 파악
- 데이터 정제하기(user id, activity, timestamp): 분석에 필요한 핵심 필드 정리
- 사용자별 메인 activity process 정의: 사용자별 주요 행동 흐름 추출
- variant 도출: 유사한 행동 패턴을 보인 사용자 군집화 및 패턴 도출을 통한 간소화
이렇게 이탈 전 마지막 행동이나 가장 오래 머문 구간 등을 정량적으로 정의하고,
그에 따라 팀 내에서 비즈니스 가설을 세워 실험을 설계했다고 한다.
이 세션을 통해 느낀 점은 같은 데이터라도 어떤 관점으로 접근하느냐에 따라 분석 방법과 결과가 전혀 달라질 수 있다는 사실이다.
"무엇을 중요하게 보는가", "어떤 방법론을 선택하는가"에 따라
이전에 보지 못했던 문제들에 대해서 확인하고 또 새로운 인사이트를 도출해 낼 수 있다는 것이다.
그래서 '다양한 분석 방법론을 알아야 하나?' 생각도 들었지만,
그보다 중요한 건 분석의 목적과 문맥에 따라 적절한 접근 방식을 택할 수 있는 판단력과 그를 통해 결과를 도출해 낼 수 있는 실행력 아닐까 생각했다.
🎙️ 주니어로 살아남기: 회사에서 스스로 커리어를 쌓는 방법
이 세션은 사실 '나는 아직 주니어도 아니지만, 앞으로 어떻게 커리어를 쌓아야 할까?' 하는 가벼운 마음으로 들어갔는데,
결과적으로는 이날 가장 인상 깊었던 발표였다.
발표자 분은 데이터 분석가로 일하면서 어느 순간 “나는 지금 무슨 일을 하고 있지?”, “내 이력서에는 어떤 경험을 적을 수 있을까?”라는 고민을 하게 되었고,
그때부터 스스로 할 수 있는 일의 범위를 정의하고 하나씩 실천해 나갔다고 한다.
가장 먼저 강조한 건 ‘조직을 이해하는 것’이었다.
조직의 성격에 따라 데이터 분석가의 역할도 달라지기 때문에,
커리어를 제대로 쌓기 위해서는 자신이 속한 조직을 먼저 이해해야 한다는 것이다.
발표자 분은 본인의 경험을 바탕으로 에이전시 분석가와 인하우스 분석가의 차이를 정리해 주셨다.
- 에이전시 분석가는 외부 클라이언트를 위한 분석을 수행하며, 실행력 중심의 성과 측정과 전략적 인사이트 제안에 초점을 맞춘다.
- 인하우스 분석가는 조직 내부의 데이터를 다루며, 구성원이 쉽게 데이터를 활용할 수 있도록 데이터 거버넌스를 구축하고, 문제 해결과 구조 설계를 주도하는 역할을 수행한다.
이러한 역할들을 경험하며 발표자는 분석가로서의 역할을
단순한 분석 수행자 → 조직 내 데이터 흐름을 설계하는 사람으로 스스로 확장해 나갔다고 한다.
- 에이전시에서는 클라이언트의 분석을 넘어 조직 내부의 데이터 체계를 설계·운영하는 사람으로,
- 인하우스에서는 데이터 기반 의사결정 문화를 기획하고 설계하는 사람으로, 시스템과 툴 교육, 인사이트 발행 등 다양한 역할을 수행하게 되었다고 한다.
그래서 지금 본인이 정의하는 역할은 다음과 같다고 말한다:
누구나 쉽게 데이터 기반 의사결정을 내릴 수 있는 환경을 기획하는 분석가
결국 분석가의 본질은 조직과 제품을 더 나은 방향으로 개선하는 사람이라는 점을 강조하며,
‘분석가의 쓰임새’를 고민하고, 그것을 기반으로 자기만의 커리어를 설계하는 것이 중요하다고 말했다.
이 발표가 유독 인상 깊었던 이유는,
지금 내가 하고 있는 고민들과 연결되어 조금은 해소할 수 있는 방향이 되지 않을까 생각했던 것 같다.
데싸 4기 과정을 들으며,
- '왜 이렇게 코드는 안 늘지?'
- '모델은 어떻게 설계하고 성능은 어떻게 더 높일 수 있지?'
- '솔직히 ChatGPT 없었으면 이 수업 따라갈 수 있었을까?'
하는 생각들을 많이 했었다.
하지만 되돌아보면, 내가 데이터에 관심이 생긴 이유는 코딩과 AI 모델이 아니라
'이런 데이터들은 어디에 쓰는 거지?
데이터로부터 무엇을 발견할 수 있을까?
그걸 바탕으로 무엇을 결정할 수 있을까?' 하는 질문들이었다.
이 발표를 들으며, 지금 당장 모든 걸 다 하려고 애쓰기보다는
지금 내가 할 수 있는 것, 하고 있는 것, 해야 하는 것에 집중하면서 내가 진짜 관심 있는 것부터 하나씩 해나가야겠다는 마음이 들었다.
p.s. 사실 다 잘하면 안 좋을 사람이 어딨을까.. 모델링도 잘하고 싶다...! 포기하는 건 아니다. 그렇지만 우선순위를 두자!
기술은 물론 중요하지만 기술만이 능력의 전부는 아닐 거다.
스스로의 방향을 설정하고, 역할을 정의하는 능력도 커리어를 만들어가는 데 있어 굉장히 중요한 요소라는 걸 알게 되었다.
🎙️ PM과 DE가 만나 AI 프로덕트를 만들면 이렇게 됩니다
이번 세션은 사이드 프로젝트의 과정이 궁금해서 들어갔다.
PM(Product Manager)과 DE(Data Engineer)가 AI 기반 음악 추천 앱을 만드는 과정을 공유해 준 자리였다.
프로젝트 소개
간단한 일기, 키워드 태그 등을 기반으로 이용자의 감정을 따른 그날의 음악을 추천하는 앱을 만드는 것이 목표였다고 한다.
PM – 기획과 리소스 조율
처음에는 욕심껏 복잡한 알고리즘?을 적용해보려 했지만,
감정과 음악처럼 주관적인 요소를 모델링한다는 건 생각보다 훨씬 어려운 일이었다고 한다.
다양한 키워드에 음악을 매칭하는 작업도 만만치 않았고,
성능과 속도 측면에서도 한계를 느껴 결국 구조 자체를 단순화하는 방향으로 정리했다고 한다.
이 과정을 통해 PM이 가장 크게 느꼈던 점은 바로 서비스와 리소스 간의 균형이었다.
“내가 하고 싶은 것을, 지금 가진 리소스 안에서 실현할 수 있는가?”
이 질문이 아주 중요한 요소라는 걸 계속해서 염두에 두고 있어야 한다는 것이다.
DE – 개발 과정에서의 역할과 시행착오
개발 과정에서도 “이건 백엔드가 도와줄 수 있는 일 아닌가?”,
“이건 데이터 사이언티스트 역할 아닌가?”라는 고민이 들었지만,
결국 그 상황에서 가장 빠르고 정확하게 해결할 수 있는 사람이 하는 것이 맞았다고 말했다.
실제로 모델 성능 개선과 속도 향상을 위해 여러 번의 시행착오를 거쳤고,
그 구체적인 과정과 고민들을 함께 나눠주었다.
이 세션을 들으며 다시 한번 느낀 재미있는 점은 기획자와 개발자의 관점은 다르다는 사실이었다.
그리고 그 다름은 발표를 듣는 나와 주변 사람들에게도 다르게 다가온다는 것.
나는 예전에 기획 업무를 해본 적이 있어서 PM 발표자 분의 ‘리소스 조율’ 이야기에 공감할 수 있었다.
반면, 함께 간 백엔드 개발자는 DE 발표자 분의 기술적 시행착오에 더 흥미를 느꼈다고 했다.
결국 같은 발표를 듣고도 각자 받아들이는 포인트가 다르기 때문에,
이런 이야기를 서로 나누고 공유하는 경험이 유익한 것이 아닐까 생각했다.
🎙️ 커뮤니티 유저 행동 분석: 어떤 사용자가 계속 들어올까?
‘행동 분석’이라는 키워드에 눈길이 가서 들어간 세션이었다.
어떤 커뮤니티인지 모르고 들어갔었는데, 발표 내용은 ‘글 쓰는 또라이’라는 이름의 기수제 개발자 커뮤니티 활동 데이터를 기반으로 한 분석 사례였다.
우선 이 커뮤니티, 그리고 해당 기수는 전반적으로 리텐션이 높은 편이었고,
발표자 분의 프로젝트팀은 리텐션이 높은 유저들이 공통적으로 경험한 어떤 ‘아하 모먼트’가 있는지 탐색하려 했다.
그러나 분석 결과, 하나의 행동으로 정의되는 공통된 순간은 없었다 고 한다.
이때 커뮤니티 운영자의 피드백 "다 살펴보세요. 하나의 행동이 아닐 수 있어요"를 계기로,
초심으로 돌아가 개별 행동보다 유저들이 커뮤니티에 참여한 목적에 집중해 관점을 전환하게 되었다고 한다.
그 후 활동 데이터를 기반으로 다음과 같은 페르소나 그룹을 정의했다:
- 글쓰기만 하는 유저
- 소모임에 참여한 적 없는 유저
- 커피챗에 참여한 적 없는 유저 등
예를 들어, 글쓰기만 하는 유저가 정말 그것만 원하는 것인지,
아니면 다른 활동에 참여할 기회가 부족했던 것인지를 파악하는 것에 접근하였다.
그리고 실제로 기회를 제공하자, 글쓰기만 하던 유저 중에서도 소모임 참여로 전환된 사례가 나타났다고 한다.
이 세션은 아쉽게도 끝까지 듣지는 못했지만, 단순한 유저 행동 분석을 넘어 커뮤니티의 성장 전략과 연결된 실질적인 분석을 스스로 모여 진행했다는 점이 인상 깊었다.
사이드 프로젝트의 일환으로 실제 커뮤니티의 참여율과 활동 전환을 이끌어내기 위해 많은 노력과 시간을 투자했다는 생각도 들었다.
'끄적노트' 카테고리의 다른 글
데이터야, 놀자(DataYa Nolja) 2025: 개인적인 인사이트 (3) | 2025.06.20 |
---|