Adobe Marketing Cloud/Adobe Audience Manager

AAM || 유의사항 : 54배수 샘플링 - Signal이 54배 뻥튀기되는 경

Awesomist 2020. 6. 2. 17:07
728x90

AAM Signal Search를 하다보면 이런 당황스러운 수치를 만날 때가 있다.

AAM 페이지 내에 Audience Data > Signals > Search

Raw Data라고 믿었던 Signal 수치가 고유값이든 아니든 54배수로 뻥튀기 되는 결과가 나온다.

 

 

 

현상1) Unique Value - (ex) 고객번호

  → 고유한 데이터값이 대해 Total Counts가 각각 54건으로 잡히는 것을 확인 할 수 있다.

현상2) 속성(Trait)로 설정하기 적합한 Dimension값  - (ex) 연령대, 성별 등등

  → 세부 수집 Signal은 블러처리했지만 모두 연령대, 성별, 등급 등 Dimension에 해당하는 항목인데,
      해당값의 Total Counts도 모두 54의 배수로 확인된다. (108, 162, 324, 702, 1836...)

 

 

 

 

왓더뻥튀기..........

 


 

Audience Manager를 사용 보고서는 사용 가능한 총 데이터의 샘플 세트를 기반으로 결과를 표시합니다.
샘플링된 데이터를 사용하는 보고서의 경우, 결과가 54개의 레코드 집합 중 1개의 레코드를 기반으로 합니다.
                                                                                              - Adobe 공식 문서 중

 ( = AAM은 고정적으로 1:54 비율로 샘플링된다. 대시보드나 AAM 연계 집계항목들 때문에 발생하는 현상이라고 한다. )

 

 

[데이터 크기별 샘플링 오류비율(Error Rate]

500 - 1,000

95%는 42%의 오류율 아래에 있다.

1,000 - 1,500

95%는 34% 이하의 오차율

10,000 - 50,000

95%는 14% 이하의 오차율

50,000

95%는 6% 이하의 오차율

100,000

95%는 4% 이하의 오차율

500,000(이상)

95%는 2% 이하의 오차율

※ 참고 : AAM 데이터 샘플링 관련 참고 사항

 

 

하지만 모든 데이터가 54배수 샘플링되지 않는다.

샘플링에 해당되지 않는 케이스는 바로 Launc와 AAM에서 자동으로 시그널로 인지하는 항목,

즉 AAM signal 중에 General Online Data로 인지하는 "d_*****" 형태의 데이터의 경우는 별도 샘플링이 발생하지 않는다.

"c_*****"형태의 데이터, 즉 DIL코드나 사용자/고객사에서 유의미하게 여기는 커스텀 항목에 해당하는 경우는 샘플링이 발생한다. 샘플링이 발생하더라도 실제 세그먼트 모수에는 영향을 주지 않는다.

 

General Online Data ("d_***"형태의 signal) 
  → 전혀 샘플링의 영향을 받지는 않지만 실제 활용도는 매우 낮은 더미데이터일 확률이 높음

 

Signal Search는 수치의 정확성을 기대하기 보다는

내가 적용해준 수집데이터가 정상적으로 들어오는지, 내가 놓친 시그널 중에 최근에 값이 좀 높은 것이 있는지 체크하는 수준의 용도로 활용하는 것이 적절해 보인다. 

 

반응형