Data Clean Room: 개인정보 보호 우선 협업에 대해 알아야 할 사항

최근 몇 년간 가장 혁신적인 요소가 무엇이었는지 광고주들에게 묻는다면, 개인정보 보호와 AI 사이에서 고민할 가능성이 높습니다. AI가 앞으로 광고뿐만 아니라 광범위한 분야에서 혁신적 영향을 미칠 것으로 예상되지만, 현재 분명한 것은 오늘날 어떤 조직도 개인정보 보호를 우선시하지 않고서는 소비자 데이터 관련 사용 사례를 처리할 수 없다는 사실입니다.
데이터 클린룸의 세계를 자세히 들여다보기 전에 먼저 그 배경부터 살펴보는 시간을 가져보도록 하겠습니다.
각국 정부, 소비자 개인정보 보호 조치 단행
인터넷의 등장으로 조직들은 그 어느 때보다 효율적으로 전례 없는 규모의 소비자 데이터를 수집하기 시작했지만, 처음에는 데이터 수집 방식을 전혀 고려하지 않은 경우가 많았습니다.
그러다가 소비자 개인정보 보호에 대한 우려가 증폭되자 2016년에야 비로소 이를 해결하기 위한 결정적인 조치가 취해졌습니다. 바로 유럽 당국이 최초의 포괄적 개인정보 보호법인 일반 데이터 보호 규정(GDPR)을 도입한 것입니다.
미국에서는 캘리포니아주 당국이 2018년, 소비자 보호를 강화하고 기업에 더욱 엄격한 규제를 적용하는 캘리포니아주 소비자 개인정보 보호법(CCPA)을 시행하며 그 뒤를 따랐습니다.
이후 미국 내 다른 주에서도 비슷한 조치가 잇따랐습니다. 콜로라도, 코네티컷, 플로리다, 몬타나, 오리건, 유타 등의 주에서 최근 자체 개인정보 보호규정을 도입했으며, 다른 주들도 이러한 추세에 동참할 예정입니다.
다른 국가들에서도 비슷한 움직임이 일고 있습니다. 전 세계적으로 데이터 보호 및 개인정보 보호법이 존재하는 국가 비율이 무려 71%에 달하고 있으며, 유엔무역개발회의(UNCTAD)에 따르면, 새로운 법안이 계속 도입되고 진화해 나가고 있습니다.
기술 기업은 개인정보 보호 이니셔티브를 통해 대응 중입니다.
최근 대형 기술 기업은 정부 규정과 별개로 자체 개인정보 보호 중심 이니셔티브를 전개하고 있습니다. 가장 큰 화두가 되고 있는 이니셔티브는 1990년대 이후 광고 산업의 중추적인 요소로 자리매김하고 있는 서드 파티 쿠키에 대한 것입니다.
처음 발표 이후 몇 번의 연기를 거듭한 끝에, Google은 당분간 Chrome에서 서드 파티 쿠키를 유지하기로 결정했습니다. 그 결과, 당장은 ‘쿠키의 종말’을 피할 수 있게 되었지만, 향후 사용자 동의와 같은 제어를 포함하여 액세스 및 사용에 대한 제한이 더욱 엄격해질 전망입니다.
eMarketer에 따르면 Google의 동의 기반 솔루션이 출시되고 Microsoft가 Edge 브라우저에서 서드 파티 쿠키를 제거하면 웹 트래픽의 최대 87%가 곧 서드 파티 쿠키로부터 해제될 수 있습니다. 한편 Apple Safari나 Mozilla Firefox와 같은 주요 브라우저에서는 이미 서드 파티 쿠키에 대한 액세스를 차단하고 있습니다.
비단 쿠키만이 아닙니다. Google과 Apple 모두 소비자 개인정보 보호 이니셔티브를 지속적으로 출시하고 있습니다. 예를 들어, Apple이 2021년에 도입한 앱 추적 투명성(ATT) 정책에 따르면 앱은 광고 목적으로 디바이스 식별자를 수집하려면 사전에 사용자로부터 명시적인 동의를 얻어야 합니다.
이러한 변화는 결국 광고 ‘수익’ 생태계 전반에 변화를 일으키고 있습니다.
Data Clean Room: 모든 것의 출발점
최초의 소비자 개인정보 보호규정이 도입될 당시 광고 산업에는 또 다른 큰 변화가 일어나고 있었습니다. 바로 Google이 더 이상 광고주에게 로그 수준의 데이터를 보내지 않을 것이라고 발표한 것입니다.
하지만 문제가 있었습니다. 해당 로그는 광고주가 캠페인 성능과를 분석하는 데 필수적이기 때문에, 이러한 데이터에 액세스하지 못하면 조직은 전략이나 예산을 효과적으로 최적화할 수 없게 된다는 것이죠.
이 문제를 해결하기 위해 Google은 광고주가 캠페인에 대한 분석 및 보고를 계속 진행할 수 있도록 설계된 솔루션인 Ads Data Hub를 도입했습니다. 하지만 또 다른 문제가 생겼습니다. 광고주가 더 이상 로그 수준의 데이터를 직접 확인하거나 추출할 수가 없게 된 것입니다. 그 대신 해당 플랫폼은 데이터 분석을 위한 개인정보 보존형 환경을 제공했습니다.
이 새로운 접근 방식을 설명하는 데 ‘차세대 인사이트 및 보고’이라는 용어가 사용되었으며, 이는 결국 데이터 클린룸 기술로 발전했습니다.
데이터 클린룸이란?
특정 기술 카테고리가 급부상하는 이유를 한마디로 규정하기는 힘들지만, 만일 해당 기술의 명칭이 약어로 회자되기 시작한 경우라면 ‘뜰' 가능성이 높습니다. 데이터 클린룸 즉 DCR이 바로 그런 경우입니다.
데이터 클린룸의 개념은 Google이 Ads Data Hub를 통해 해결한 문제와 동일한 과제에서 비롯됐습니다. 즉, 기초 데이터를 노출하지 않고 두 당사자 간의 데이터 협업을 가능하게 만드는 것이죠.
퍼스트 파티 데이터는 조직이 보유하고 있는 가장 귀중한 자산 중 하나입니다. 따라서 퍼스트 데이터에 대한 액세스를 제공하는 것은 매우 민감한 문제입니다. 그러나 여러 당사자가 소유하는 데이터 세트를 분석하는 것이 꼭 필요한 상황이 있습니다.
데이터 클린룸은 여러 조직 또는 단일 조직 내의 여러 비즈니스 단위가 개인정보 보호를 침해하지 않고 민감한 데이터 또는 규제 대상 데이터에 대해 협업할 수 있도록 하는 안전하고 통제된 환경을 지원합니다.
이렇게 구성된 보호 시스템의 핵심 요소는 개인정보 보호 강화 기술(PET)의 사용입니다. 여기에는 차등 개인정보 보호, 집합 및 투영 정책, 합성 데이터 생성과 같은 기법이 포함됩니다.
데이터 클린룸의 사용자 및 사용 사례
앞서 언급했듯이 데이터 클린룸은 처음에는 광고 업계의 주목받았습니다. 특히 퍼블리셔가 세분화된 데이터를 직접 액세스할 필요 없이 광고 캠페인의 성과를 측정하는 용도로 관심을 끌었습니다.
하지만 시간이 지남에 따라, 광고 이니셔티브에서 다양한 역할을 가진 다양한 이해관계자를 대상으로 협업 범위가 확장되었습니다.
브랜드: 유료 광고를 통해 신규 고객을 확보하고 수익을 창출하는 데 중점을 둡니다.
퍼블리셔 및 미디어 네트워크: 데이터 및 광고 인벤토리 수익화를 목표로 합니다.
에이전시: 광고주와 퍼블리셔에게 캠페인 실행 및 전략을 지원합니다.
기술 공급업체 및 데이터 공급자: 광고 생태계 내 통합과 같은 데이터, ID 솔루션 및 서비스를 판매합니다.

iSpot은 광고 중심의 측정 회사로서, 브랜드가 플랫폼 전반에 걸쳐 측정을 통합하고 , 크리에이티브 단계부터 타깃층, 그리고 결과에 이르는 전 캠페인 생애 주기에서 관련 요소들의 유기적인 관계를 이해하는 데 많은 투자를 하고 있습니다. 그리고 클린룸은 당사의 브랜드 및 퍼블리셔 고객들이 개인정보 보호 규정을 준수하는 방식으로 이러한 인사이트를 실질적인 조치로 전환할 수 있도록 지원해주는 훌륭한 도구임이 입증되었습니다.
Nick Aluia
이러한 이해관계자들 사이에서 형성된 파트너십을 기반으로 지금은 다음과 같은 일반적인 광고 협업 사용 사례가 존재합니다.
데이터 보강 및 ID: 파트너는 퍼스트 파티 데이터를 개선하고 전달성을 높일 수 있습니다.
전략적 계획: 광고주는 광고 예산 지출처를 결정하고 가장 관련성 높은 잠재 고객을 식별할 수 있습니다.
캠페인 활성화: 직접 또는 파트너 지원 채널을 통해 소비자에게 도달할 수 있습니다.
측정 및 최적화: 조직은 전환에 미치는 채널의 영향을 이해하고 미디어 지출을 개선할 수 있습니다.
예를 들어, Booking.com은 캠페인 성과를 보다 효과적으로 측정하기 위해 Snowflake Data Clean Room을 사용하여 Snap과 파트너십을 맺었습니다. 이러한 협업을 통해 결과에 대한 자신감이 20% 미만에서 99%로 급등했습니다.
그러나 데이터 클린룸의 잠재력은 광고 산업을 넘어 아래와 같은 다른 산업에서도 발휘될 수 있습니다.
헬스케어: 민감한 정보를 노출하지 않고 실험실과 헬스케어 시설 간에 안전한 데이터 분석을 가능하게 하여 약물 연구 및 개발을 가속화하고 있습니다.
금융 서비스: 사기 감지를 가속화하고 신용 평가 모델을 개선하는 동시에 고객 데이터를 보호하고 있습니다.
광고 산업은 데이터 클린룸 기술의 가치를 입증하기 위한 출발점에 불과합니다. 여러 산업들이 안전한 개인정보 보존형 데이터 협업의 이점을 계속 인식해감에 따라 향후 몇 년 동안 더욱 광범위하게 산업 채택 이루어질 것으로 예상됩니다.
데이터 클린룸이 여타 기술과 다른 점
일반적으로 데이터 클린룸이 데이터 공유 기술과 동일하다는 잘못된 편견이 존재합니다. 데이터 소유자는 안전한 데이터 공유 솔루션을 통해 특정 제어 기능을 사용하여 데이터 세트를 공유할 수 있습니다. 데이터 공유의 목표는 세분화된 기초 데이터에 대한 액세스를 제공하는 것입니다. 이는 데이터 클린룸의 목적과 정반대입니다. 데이터 클린룸은 데이터 분석을 가능하게 하는 동시에 이러한 액세스를 방지하도록 설계되어 있습니다.
데이터 클린룸과 비교되는 또 다른 기술 카테고리는 고객 데이터 플랫폼(CDP)입니다. 두 기술 모두 가치를 실현하기 위해 퍼스트 데이터에 의존하지만, 그 외는 유사점이 없습니다. CDP는 마케팅 담당자와 광고주가 브랜드의 퍼스트 파티 데이터 액세스하여 개인화된 고객 경험을 오케스트레이션하는 데 중점을 두지만 외부 데이터 소유자와의 안전한 협업을 촉진하는 데 필요한 도구와 수단은 갖고 있지 않습니다.
데이터 클린룸의 작동 방식
복수의 당사자 간에 협업 계약이 체결되면 ‘데이터 공급자’로 불리는 데이터 소유자가 클린룸 환경을 설정합니다. 데이터 공급자는 클린룸 내에서 액세스할 수 있는 데이터를 결정하고 잠재 고객 중첩 분석 또는 닮은꼴 모델링처럼 해당 데이터 세트에서 허용되는 활동을 지정합니다.
협업에 참여하는 각 당사자는 시간에 구애받지 않고 언제나 데이터 세트를 완전히 제어할 수 있습니다. 필요에 따라 데이터 액세스 권한을 부여하거나 취소하는 방식으로 데이터를 관리하고 소유권을 유지할 수 있습니다.
클린룸 내에서 데이터 세트 액세스가 가능해지면 데이터 세트 간의 일치 프로세스가 필요합니다. 이때, 데이터 클린룸에 따라 특정 식별자를 매칭 키로 사용해야 하는 경우도 있지만, 협력 당사자들의 상호 합의하에 원하는 기준을 사용할 수도 있습니다. 협업이 성공하려면 데이터 세트 간에 지정된 데이터 포인트(예: 특정 필드)의 값이 정확하게 일치해야 합니다.

클린룸에서의 협업은 많은 경우, 원하는 인사이트를 얻은 후에 종료됩니다. 하지만 일부 시나리오에서는 데이터 클린룸이 해당 결과 데이터 세트를 허용된 채널에서 활성화시킬 수 있습니다.
데이터 클린룸 외 필요 요소
데이터 클린룸은 안전한 데이터 협업을 촉진하지만, 개인정보 보호는 기술 하나만으로는 불가능합니다. 진정한 개인정보 보호를 위해서는 소비자에서부터 시작되는 종합적인 전략이 필요합니다.
조직이 다른 당사자와 데이터 협업을 원할 경우, 소비자 동의를 획득하는 것은 협상의 대상이 아닙니다. 소비자의 동의를 얻으려면 투명성을 우선시하고 명확한 가치 교환을 보장해야 합니다. 오늘날 데이터 가치에 대한 소비자들의 인식은 날로 높아지고 있고, 따라서 그에 대한 반대 급부를 모른 채 데이터를 공유할 가능성은 점점 낮아지고 있습니다.
데이터 클린룸을 통해 제공되는 최첨단 개인정보 보호 및 보안 기술에도 불구하고 조직은 강력한 데이터 거버넌스 관행을 수립해야 합니다. 이러한 관행은 규정을 준수하고 신뢰를 유지하기 위해 데이터 액세스 및 사용량과 관련된 모든 활동을 관리해야 합니다.
데이터 협업을 위한 Snowflake Data Clean Room
수천 곳의 조직은 민감한 규제 대상 데이터 세트를 포함한 퍼스트 파티 데이터를 안전하게 저장하고 처리하기 위해 Snowflake AI 데이터 클라우드 채택했습니다. Snowflake는 신뢰할 수 있는 인프라 통합 거버넌스 모델을 통해 일관되게 적용되는 포괄적인 규정 준수, 보안 및 개인정보 보호 관리 기능을 제공합니다.
Snowflake Data Clean Room은 AI 데이터 클라우드상에 배포된 Snowflake Native App으로 개인정보 보존형의 신뢰할 수 있는 데이터 협업 환경을 제공합니다. 기술 팀과 비즈니스 팀 모두를 지원하기 위해 설계된 이 플랫폼은 데이터 개인정보 보호를 침해하지 않고도 안전한 협업을 단순화할 수 있습니다.
조직은 Snowflake 생태계 내에서 원활하게 통합 때문에 Snowflake Data Clean Room을 선택합니다. 또한 다음과 같은 고유한 이점도 중요한 요인으로 작용합니다.
중립성: 애그노스틱하고 중립적인 솔루션으로 이해 충돌을 방지할 수 있습니다. 대안 솔루션과 달리 Snowflake는 데이터, ID 솔루션 또는 미디어를 판매하지 않기 때문에 이해 충돌이 발생하지 않으므로, 진정으로 중립적인 옵션이라 할 수 있습니다.
신뢰성: 선도적인 퍼블리셔와 산업 전문가가 신뢰하는 클린룸 기술을 활용하여 협업을 가속화할 수 있습니다.
리전 및 클라우드 간 상호운용성: AWS, Microsoft Azure, Google Cloud 등 원하는 클라우드 인프라를 사용하여 파트너와 협업이 가능합니다.
가상 이벤트 ‘Accelerate Media and Entertainment’에 참여하여 데이터 협업의 미래에 대해 자세히 알아보세요.