기준점 적용됨 ? 데이터 기준점 이란?
GA4에서 보고서를 확인하다가 보면 ” 기준점 적용됨 (데이터 기준점) ” 이라는 메시지를 발견할 수 있습니다. 그위에는 ” 샘플링되지 않은 보고서 ” 라는 메시지도 함께 확인할 수 있습니다.
대체 무슨 뜻일까? 라는 생각을 하시는 분이 꽤 많을 거라 생각됩니다.
이번 글에서는 ” 기준점 적용됨(데이터 기준점) ” 에 대해 살펴보겠습니다.
목차.
1. 기준점 적용됨 (데이터 기준점) 이란?
GA4 보고서를 확인하다가 보면 상단에 주황색 느낌표가 표시됩니다. 클릭하면 “기준점 적용됨” 이라는 경고 메시지가 표시됩니다. (보고서가 샘플링되지 않았다는 내용도 표시됩니다)
2. 원인이 무엇일까요?
구글애널리틱스4 (GA4)의 기준점은 구글 신호 (Google Signals)라는 기능으로 발생합니다. 기본적으로 비활성화되어 있지만 활성화하면 기준점이 적용되기 시작합니다.
그럼, GA4 설치 후 구글 신호 데이터를 활성화하려는 이유가 무엇일까요?
우선, 구글 신호 데이터가 무엇인지 빠르게 알아보겠습니다.
구글 신호 데이터를 사용하면 여러 기기와 플랫폼에서 사용자를 추적할 수 있습니다. 활성화되면 구글 신호 데이터는 구글 계정에 로그인하고 구글 계정 설정에서 기능을 활성화한 사용자로 부터 데이터를 수집합니다.
그런 다음 이 데이터는 인구통계, 관심사 및 기타 특성에 대한 인사이트를 제공하는 데 사용됩니다.
구글 신호 데이터가 활성화 되면 GA4 속성에서 더 많은 데이터를 수집하고 특정 기능을 잠금 해제합니다.
- GA4에서 인구통계 데이터를 채우기 시작합니다.
- 이를 통해 GA4 잠재고객을 구글애즈 (Google Ads)에서 리타겟팅 잠재고객으로 재 사용할 수 있습니다.
그러나 위와 함께 ” 기준점 적용됨(데이터 기준점) ” 이 시작합니다.
3. GA4 에서 데이터 기준점의 영향은 무엇일까요?
GA4 보고서를 확인하고 있고 구글 신호 데이터의 데이터가 포함되어 있는 경우 GA4는 보고서에서 사용자 수가 적은 행을 숨깁니다. 정확한 숫자는 모르지만 행당 사용자/이벤트가 50명 미만인 것 같습니다.
따라서, 트래픽 획득 보고서를 보고 있고 해당 기간에 50명 미만의 사용자를 생성한 일부 트래픽 소스가 있는 경우 GA4 인터페이스는 해당 데이터를 숨깁니다. 데이터베이스에는 저장되지만 표시만 되지 않습니다.
한가지 예를 들면, 방문자를 웹사이트로 유도하는 고유한 트래픽 소스가 30개 이상 있는 웹사이트가 있습니다.
그러나 데이터 기준점이 시작되면 50명 (또는 그 이상) 이상의 사용자를 유도한 항목만 표시됩니다.
① 데이터 기준점이 적용되면 표시되는 소스 숫자가 줄어든 것을 확인할 수 있습니다.
4. 구글은 왜 데이터 기준점을 만든 걸까요?
공식적으로 구글 신호 데이터가 보고서에 추가하는 데이터(예:연령, 성별 등)를 기반으로 개별 사용자를 식별하지 못하도록 하기 위함이라고 말합니다.
솔직히, 이것을 기반으로 어떻게 사용자를 식별할 수 있을지는 모르겠지만(예를 들어 구글 신호 데이터는 빅쿼리(Bigquery)로 내보내지지 않기 때문입니다) 구글은 이러한 이유때문에 데이터 기준점을 만들었습니다.
그리고, GA4 사용자로서 우리가 데이터 기준점을 컨트롤 할 수 없습니다.
5. GA4에서 데이터 기준점을 피하는 방법은 무엇일까요?
먼저, GA4에서 데이터 기준점을 피하기 위해 사전에 할 수 있는 작업은 매우 간단합니다.
” 구글 신호(Google Signals)를 사용하지 마세요 ” 입니다.
인구통계 보고서를 사용할 계획이 없고 구글애즈에서 리마케팅을 위해 GA4 잠재고객을 사용할 계획이 없다면 구글 신호 사용 설정을 해서는 안됩니다.
이전에 구글 신호 데이터를 활성화한 후 현재 비활성화하면 어떻게 될까요?
분석하는 기간 범위에 더 이상 구글 신호 데이터가 포함되지 않으면 데이터 기준점을 적용하지 않아야 합니다. 그러나, 구글 신호로 오래된 데이터가 포함된 기간을 분석하면 다시 데이터 기준점이 시작됩니다.
6. ” 기준점 적용됨 ” 경고가 표시되면 어떻게 해야 할까요?
① 삼각형 경고 표시를 클릭합니다.
② 기준점 적용됨 표시를 확인할 수 있습니다.
이러한 문제에 대해 해결할 수 있는 방법은 기본 보고ID를 변경하여 데이터 기준점을 해제할 수 있습니다. 그러나, 주의 사항도 있습니다.
먼저, 보고 ID를 어디에서 변경해야 하는지 설명드리고 그 의미를 설명드리겠습니다.
기본 보고 ID는 GA4가 웹/앱 사용자를 계산하는 방식에 영향을 미치는 기능입니다. 그럼, 보고 ID 변경하는 방법에 대해 알아보겠습니다.
① [관리] > [보고 ID] 를 선택합니다.
② 오른쪽 하단에 [모두 표시]를 클릭합니다.
우리는 3가지 옵션을 선택할 수 있습니다.
- 혼합됨
기본적으로 선택되어 있는 옵션입니다. 사용자 ID > 구글 신호 데이터 > 기기 ID > 모델링 순으로 데이터를 수집합니다.
여기서 모델링은 GA4 머신 러닝을 통해 데이터를 모델링해서 수집합니다. - 관찰됨
사용자 ID > 구글 신호 데이터 > 기기 ID 순으로 데이터를 수집합니다. - 기기 기반
장치 ID(자사 쿠키라고도 함)만 사용합니다. 동일한 사용자가 여러 브라우저/장치를 사용하는 경우 GA4는 이를 별도의 사용로 취급합니다.
혼합됨, 관찰됨 보고 ID를 사용하고 구글 신호 데이터에서 데이터를 수집한 경우 데이터 기준점이 적용될 수 있습니다.
그러나, 기기 기반으로 전환하면 구글 신호 데이터를 사용하여 사용자를 계산하지 않으며 데이터 기준점이 사라집니다.
7. 기준점 적용됨(데이터 기준점) 으로 인해 큰 이슈가 생기게 될까요?
제 생각으로는 50명 미만 (적어도 트래픽 획득 보고서에서) 행은 일반적으로 전체 트래픽의 5%미만을 차지합니다.
따라서, GA4는 모델링된 데이터 또는 사용자 ID/구글 신호 데이터로 일부 격차를 메우려고 하기 때문에 데이터 정확도에 큰 문제가 되지 않는다는 생각을 가지고 있습니다.
그러나, 이슈가 생기게 되는 상황도 물론 발생할 수 있습니다. 예를 들어 소규모 웹사이트 (하루 또는 주에 수백명의 방문자가 방문하는 웹사이트)는 이슈가 발생할 수 있습니다. 이벤트가 많지 않기 때문에 보고서에서 이벤트의 절반을 볼 수 없다고 생각하면 문제가 될 수 있을 것입니다.
이때는 반드시 기기 기반 보고 ID를 사용하셔야 합니다.
FAQ
GA4에서 기준점 적용됨 (데이터 기준점)이 적용되는 이유는 무엇인가요?
기준점 적용됨 (데이터 기준점)은 보고서 또는 탐색을 보는 사람이 데이터에 있는 인구통계, 관심사 또는 기타 신호를 기반으로 개별 사용자의 신원을 알 수 없게 하기 위해 적용되는 것입니다.
GA4에서 기준점 적용됨 (데이터 기준점)을 어떻게 제거합니까?
기준점 적용됨 (데이터 기준점)은 제거할 수 없습니다. 데이터 기준점은 구글에서 설정하며 구글 신호 데이터를 사용하는 경우 삭제할 수 없습니다. 그러나 보고 ID를 기기 기반으로 전환하여 데이터 기준점을 방지할 수 잇습니다.
2 Comments
설명 감사합니다!
기준점으로 인해서 당일이나 전일 데이터 수신이 느려지기도 할까요?
대략 48시간 이전 데이터는 UA데이터와 비교해서 큰 차이가 없으나 전일, 당일 데이터는 전환수치에 차이가 크기에 드리는 질문입니다
안녕하세요. 디애널리틱스 입니다.
데이터 기준점으로 인해 데이터 수신이 느려지거나 빨라지거나 하지 않습니다.
데이터 기준점을 적용한 이유는 보고서나 탐색 분석 데이터에서 개별 사용자의 신원 추론 방지를 위해서 입니다.
전일 또는 당일 데이터의 전환수치 차이가 나는 것은 아무래도 데이터 수집 적용시간 때문인 것으로 판단됩니다.
트래픽의 양이 어느정도 되느냐에 따라서도 적용시점이 다르기 때문에 수치값에 영향을 주기도 합니다. (해외 커뮤니티에서는 UA보다 GA4가 데이터 수집 적용시간이 더 길다는게 중론입니다)
결론적으로, 지금까지는 데이터 기준점이 데이터 수신에 영향을 준다는 이야기는 없습니다.
답변이 만족스러웠으면 좋겠네요. 🙂
다른 질문이 있으시면 언제든지 문의 주세요.