AAM || 유의사항 : 54배수 샘플링 - Signal이 54배 뻥튀기되는 경
AAM Signal Search를 하다보면 이런 당황스러운 수치를 만날 때가 있다.
AAM 페이지 내에 Audience Data > Signals > Search
Raw Data라고 믿었던 Signal 수치가 고유값이든 아니든 54배수로 뻥튀기 되는 결과가 나온다.
현상1) Unique Value - (ex) 고객번호
→ 고유한 데이터값이 대해 Total Counts가 각각 54건으로 잡히는 것을 확인 할 수 있다.
현상2) 속성(Trait)로 설정하기 적합한 Dimension값 - (ex) 연령대, 성별 등등
→ 세부 수집 Signal은 블러처리했지만 모두 연령대, 성별, 등급 등 Dimension에 해당하는 항목인데,
해당값의 Total Counts도 모두 54의 배수로 확인된다. (108, 162, 324, 702, 1836...)
Audience Manager를 사용 보고서는 사용 가능한 총 데이터의 샘플 세트를 기반으로 결과를 표시합니다.
샘플링된 데이터를 사용하는 보고서의 경우, 결과가 54개의 레코드 집합 중 1개의 레코드를 기반으로 합니다.
- Adobe 공식 문서 중
( = AAM은 고정적으로 1:54 비율로 샘플링된다. 대시보드나 AAM 연계 집계항목들 때문에 발생하는 현상이라고 한다. )
[데이터 크기별 샘플링 오류비율(Error Rate]
500 - 1,000 |
95%는 42%의 오류율 아래에 있다. |
1,000 - 1,500 |
95%는 34% 이하의 오차율 |
10,000 - 50,000 |
95%는 14% 이하의 오차율 |
50,000 |
95%는 6% 이하의 오차율 |
100,000 |
95%는 4% 이하의 오차율 |
500,000(이상) |
95%는 2% 이하의 오차율 |
※ 참고 : AAM 데이터 샘플링 관련 참고 사항
하지만 모든 데이터가 54배수 샘플링되지 않는다.
샘플링에 해당되지 않는 케이스는 바로 Launc와 AAM에서 자동으로 시그널로 인지하는 항목,
즉 AAM signal 중에 General Online Data로 인지하는 "d_*****" 형태의 데이터의 경우는 별도 샘플링이 발생하지 않는다.
"c_*****"형태의 데이터, 즉 DIL코드나 사용자/고객사에서 유의미하게 여기는 커스텀 항목에 해당하는 경우는 샘플링이 발생한다. 샘플링이 발생하더라도 실제 세그먼트 모수에는 영향을 주지 않는다.
General Online Data ("d_***"형태의 signal)
→ 전혀 샘플링의 영향을 받지는 않지만 실제 활용도는 매우 낮은 더미데이터일 확률이 높음
Signal Search는 수치의 정확성을 기대하기 보다는
내가 적용해준 수집데이터가 정상적으로 들어오는지, 내가 놓친 시그널 중에 최근에 값이 좀 높은 것이 있는지 체크하는 수준의 용도로 활용하는 것이 적절해 보인다.