지난 이기적멤버십 마케팅 공유회에서 셀피쉬클럽의 데이터팀이 공유한 "데이터 황무지 간척사업 성공기"가 생각보다 많은 반응을 얻었어요. 특히 데이터 엔지니어나 애널리스트를 따로 채용하기 어려운 초기 스타트업 팀들한테는 꽤 현실적인 도움이 될 만한 내용이었거든요.
웨비나에서는 시간 관계상 다루지 못했던 구체적인 방법론과 실무 팁들이 있어서, 이 글로 좀 더 자세히 풀어보려고 해요. 셀피쉬클럽이 어떻게 행사별로 흩어진 데이터를 유저 중심의 체계적인 구조로 재편했는지, 그리고 이 과정에서 마주한 현실적인 문제들을 어떻게 해결했는지 생생한 경험을 나누려고 합니다.
셀피쉬클럽은 다양한 마케팅, AI, 커리어 관련 행사를 운영하는 커뮤니티 비즈니스예요. 셀피쉬월드, 천하제일스타트업체육대회, 디지털잡부페스티벌, AI블로그챌린지 등 매달 여러 개의 행사가 동시다발적으로 진행되고 있어요.
문제는 각 행사마다 별도의 신청 폼과 데이터베이스가 생긴다는 점이었어요. 행사를 기획하는 PM들은 빠른 실행을 위해 각자 필요한 데이터만 수집했고, 결과적으로 데이터가 행사별로 완전히 분리되어 버린 거죠.
이런 구조에서는 정말 중요한 질문들에 답할 수가 없더라고요:
각 행사별로만 데이터가 쌓이니까 전체적인 유저 여정을 파악할 수가 없었어요. 이는 곧 데이터 기반 의사결정이 불가능함을 의미했거든요.
가장 먼저 해야 할 일은 데이터 구조를 근본적으로 재설계하는 것이었어요. 기존의 행사 중심 구조에서 유저(멤버) 중심 구조로 전환해야 했거든요.
핵심 테이블 구조는 이렇게 정의했어요:
이 구조의 핵심은 모든 데이터가 최종적으로 멤버 테이블로 수렴된다는 점이에요. 어떤 경로로 유입되든 상관없이 하나의 유저 아이디로 통합 관리할 수 있게 되는 거죠!
데이터 통합 과정에서 가장 중요하게 고려한 것은 개인정보 보호였어요. 유저의 실제 개인정보(이름, 전화번호, 이메일)에는 데이터 엔지니어인 판다와 코이만 접근할 수 있도록 권한을 제한했어요.
대신 각 유저에게 고유한 유저 ID를 부여하고, 다른 팀원들은 이 ID를 기준으로 데이터를 활용할 수 있도록 했거든요. 이렇게 하면 개인정보는 안전하게 보호하면서도 필요한 분석과 마케팅 활동은 자유롭게 할 수 있어요.
초기 스타트업에서 별도의 데이터 엔지니어링 인프라를 구축하기는 현실적으로 어려워요. 구글에서 무료로 제공하는 ‘앱스 스크립트’를 활용하면 여러 구글 스프레드 시트를 연동하여 상당히 정교한 데이터 자동화를 구현할 수 있답니다!
셀피쉬클럽에서는 이런 자동화들을 구현했어요:
신규 멤버 자동 생성
데이터 정합성 검증
셀피쉬클럽 하면 AI, AI 하면 셀피쉬클럽! 앱스 스크립트 코드 작성에는 ChatGPT와 Claude(클로드)는 물론, 개발 AI '키로(Kiro)'도 적극 활용했어요. 복잡한 로직도 자연어로 설명하면 상당히 정확한 코드를 생성해줘서 개발 속도를 높일 수 있었거든요.
특히 데이터 검증이나 변환 로직 같은 반복적인 작업들은 AI의 도움으로 빠르게 구현할 수 있었어요. 물론 생성된 코드는 반드시 검토하고 테스트를 거쳐야 하지만, 초기 프로토타입 단계에서는 정말 유용했어요.
데이터 구조를 정리했다고 끝이 아니에요. 이 데이터를 시각화하여 팀원들이 쉽게 활용할 수 있도록 해야 하거든요. 이때 가장 쉽게 활용할 수 있는 것이 바로 ‘대시보드’! 하지만 기존의 대시보드들은 몇 가지 심각한 문제가 있었어요:
규칙 없는 중복 생성
웹사이트 유입 데이터 부족
이런 문제 해결을 위해 대시보드 구축에 대한 명확한 컨벤션을 정의했어요:
Data Source, Filter, Custom Field 통일
Blended Data 활용
이렇게 하니까 PM들이 대시보드를 새로 만들 때도 일관된 방식으로 구축할 수 있고, 팀 간 소통도 훨씬 원활해졌어요.
웨비나에서는 시간 관계상 다루지 못했지만, 실제로는 데이터 유실 문제도 있었어요. 일부 결제 데이터가 누락되거나, 플랫폼 간 연동 오류로 인한 데이터 불일치가 발생했던 거죠.
이런 복잡한 문제를 해결하기 위해 'Tool Chaining' 방식을 활용했어요. 여러 도구들을 연결해서 마치 하나의 통합 시스템처럼 동작하게 만드는 방법이거든요.
웹플로우 신청 → 토스페이먼츠 결제 → 파이어베이스 인식 → 구글 시트 입력
각 단계에서 앱스 스크립트나 API 연동을 통해 데이터를 자동으로 가져오고, 최종적으로는 하나의 통합된 뷰를 만들 수 있었어요.
이 과정에서 중요한 건 각 도구의 특성을 이해하고, 데이터 흐름을 명확히 설계하는 거예요. 복잡해 보이지만 실제로는 기존 도구들의 조합으로 상당히 정교한 시스템을 구축할 수 있더라고요.
기술적인 구현도 중요하지만, 데이터 엔지니어링의 궁극적인 목적은 두 가지예요:
1️⃣ 분석: 우리가 새로운 유저를 잘 데려오고 있는지, 재획득 유저는 얼마나 되는지 파악
2️⃣ CRM: 개인화된 마케팅과 고객 관계 관리
이 두 가지가 제대로 작동하려면 데이터가 정리되어 있어야 할 뿐만 아니라, 팀 전체가 데이터를 활용할 수 있는 문화가 만들어져야 해요.
데이터팀의 역할은 단순히 데이터를 정리하는 게 아니라, 다른 팀원들이 더 쉽고 빠르게 데이터를 활용할 수 있도록 안내하는 거예요. 혼자만 데이터를 잘 다루는 게 아니라, 팀 전체가 데이터 기반으로 의사결정할 수 있는 환경을 만드는 거죠.
이를 위해 이런 접근을 했어요:
내부 공유회와 가이드라인 제공
셀프 서비스 환경 구축
지속적인 개선과 피드백
셀피쉬클럽의 데이터 황무지 간척 프로젝트는 거창한 기술이나 대규모 투자로 시작되지 않았어요. 문제를 명확히 정의하고, 기존 도구들을 창의적으로 조합하며, 팀원들과 지속적으로 소통한 결과였거든요.
가장 중요한 교훈은 완벽한 시스템을 한 번에 만들려고 하지 말고, 작은 문제부터 하나씩 해결해 나가는 거예요. 그 과정에서 팀 전체가 데이터의 가치를 체감하고, 자연스럽게 데이터 기반 의사결정 문화가 만들어져요.
1️⃣ 현재 우리 팀의 데이터 흐름 그려보기: 어디서 어떤 데이터가 생성되고, 어떻게 흘러가는지 시각화
2️⃣ 가장 자주 묻는 질문 3가지 정리: 답하기 어려운 질문들이 바로 데이터 구조 개선이 필요한 지점
3️⃣ 구글 앱스 스크립트 튜토리얼 따라하기: 간단한 자동화부터 시작해서 점진적으로 복잡한 로직 구현
4️⃣ 팀원들과 데이터 관련 불편함 공유: 어떤 데이터가 필요한지, 현재 어떤 부분이 불편한지 솔직하게 논의
데이터 엔지니어링은 특별한 사람만 할 수 있는 일이 아니에요. 문제를 체계적으로 접근하고, 기존 도구들을 창의적으로 활용할 수 있다면 누구나 시작할 수 있어요. 여러분의 팀도 오늘부터 작은 변화를 시작해 보세요.