본문 바로가기
디지털 마케팅

[구글 애널리틱스 자격증] 데이터 적재 원리 Part.1

by 빅맥BIGMAC 2021. 12. 26.
728x90
반응형
반응형

안녕하세요. 이번 시간에는 지난 시간에 데이터 측정 기준과 측정 항목에 대해서 다뤘는데요. 이번 시간에는 데이터 적재 원리에 대해서 다뤄보도록 하겠습니다. 이게 구글 애널리틱스 보고서의 데이터가 어떻게 적재되는지 확인을 하고 넘어가야지 데이터를 읽을 있기 때문에 부분이 굉장히 중요하다고 있습니다. 그래서 일단은 보고서에 데이터가 적재되는 원리를 이해하고요 그다음에 이게 데이터가 어떻게 적재되느냐에 따라서 히트 사용자 세션이라는 개념으로 나뉘는데요.

개념에 대해서 하나씩 설명을 드리도록 하겠습니다. 그래서 지금 일단은 잠재 고객 에요라는 보고서예요. 그래서 데이터를 보시면 개요에 대해서도 사용자 그다음에 세션 그리고 페이지 다음에 이탈률 신규 방문자 이렇게 해가지고 개념들이 나뉘게 되는데요.

이거를 정리를 해보면 일단은 크게 사용자 세션 히트 그리고 종료라는 개념이 있습니다. 이거에 대해서 하나씩 알아보도록 하겠습니다. 그래서 일단은 히트 세션 사용자에 대해서 알아주셔야 되는데요. 이게 지금 보시면 이렇게 위계 구조를 가지고 있어요. 그래서 사용자 세션 히트 지금 히트 같은 경우는 가장 개념으로 담당하고 있고 이게 가장 많이 찍힌다고 보면 되고요 그다음에 세션이라는 거는 다음으로 히트가 모여가지고 하나로 뭉쳤다고 보시면 되고 세션을 이루는 많은 세션들이 사용자를 구성한다고 보시면 되겠습니다. 그래서 히트부터 설명을 드릴게요

그래서 지금 구글 애널리틱스에서 가장 작은 데이터 단위로 히트라는 거는 애널리틱스 고객센터에서는 사실 조회라는 용어를 쓰는데요. 이게 영어에서는 그냥 히트로 나와서 히트로 그냥 보시는 맞고요 조회는 약간 초월 번역을 했다고 보시면 되겠습니다.

그래서 일단은 히트라는 개념이 있는데 간단하게 설명드리면 이게 유저가 있고요 그다음에 웹사이트에 유저가 방문을 하잖아요. 그러면 구글 애널리틱스 코드가 있어서 코드를 조회를 하게 됩니다. 그래서 코드가 한번 서버를 구글 애널리틱스의 서버를 기록을 하게 되는데 기록을 하면서 페이지 뷰라는 것을 기록을 하게 되고 이벤트라는 것을 기록할 수도 있고 그다음에 거래라는 것을 기록을 수도 있습니다. 이런 개념들은 나중에 본격적으로 다룰 계획이고요 개념들이 하나씩 다뤄질 때마다 히트가 되는 구조로 되어 있습니다. 그래서 예를 들어서 유저가 웹사이트에 들어와서 페이지 뷰를 한번 찍었어요. 그러면 이게 하나의 히트로 기록이 되고요 그다음에 유저가 또다시 어떤 회원가입 이벤트를 발생을 시켰으면 그게 히트가 되고요 그다음에 거래 완료라는 것을 발생시키면 그것도 히트로 기록이 됩니다. 그래서 이런 이벤트 거래 페이지 이런 것들을 각각 히트라고 있고 사용자가 찍으면 찍을수록 계속 증가하는 숫자로 기록이 되게 됩니다.

다음으로는 세션이라는 개념인데요. 세션은 세션 아까 히트라고 말씀드렸잖아요. 그러면 히트들은 사실 번씩 번씩 계속 기록되는 개념이에요. 근데 사실 웹사이트로 유저가 방문하게 되면 웹사이트에서 여러 군데를 이렇게 보게 되고 페이지뷰를 번만 발생시키는 아니잖아요.

그러면 개념 자체가 웹사이트에서 일정 기간 동안 그러니까 방문을 하면 끝날 때까지 기간을 세션이라고 말하는 거거든요. 그래서 개념을 사용해서 예를 들어서 페이지뷰를 발생시켰고 이벤트를 발생시켰고 거래를 발생시켰어요. 그거를 기간 동안 이거를 세션이라고 뭉뚱그려서 말한다고 보시면 되겠습니다. 그래서 유저가 어제 방문을 했고 오늘 방문을 해서 따로따로 페이지 이벤트 거래를 이렇게 따로따로 발생을 시켰다면 이거는 세션 2회로 이렇게 구성이 된다고 보시면 되겠습니다. 그래서 기본 세션 시간은 일단 30분이고요 30분이 계속해서 예를 들어서 페이지뷰 30 동안 페이지뷰를 여러 발생시킨다는 그런 개념이 아니라 페이지뷰를 계속해서 발송시키면 결국에는 페이지뷰는 방문을 해서 끝까지 계속 지속이 되게 됩니다. 그래서 세션이

 

그냥 무한대로 계속 늘어날 수도 있어요. 사실 세션 같은 경우는 30분이라는 기본 시간이 있는데 시간은 사실 이게 세션이 끝나는 그러니까 아무런 행동이 없이 만약에 페이지 뷰를 30 전에 찍었고 그다음에 30 이후에 행동을 아무 행동도 없으면 이게 세션이 종료가 된다는 개념이 있는데 개념에서 나온 그런 시간이라고 보시면 되고 개념에 대해서는 이따가 세션 종료에 대해서 얘기를 조금 자세히 다루도록 하겠습니다.

다음은 사용자인데요. 사용자 아까 앞에 말씀드렸던 유저라는 개념이 있어서 유저가 웹사이트에 들어오고 이제 히트를 발생시키고 세션을 발생시키잖아요. 세션 히트 그다음에 유저 개념을 뭉뚱그려서 사용자 명이 행동을 했기 때문에 이거는 이제 사용자 명이 행동을 했다고 이런 개념을 사용을 하게 됩니다.

그래서 예를 들어서 웹사이트에 어떤 a라는 사용자가 들어오면 a라는 사용자가 이런 행동을 했다고 보게 되고 예를 들어서 히트는 지금 6번이잖아요. 그리고 세션은 번인데 사용자는 명이 되는 그런 개념이라고 보실 있습니다. 그래서 이런 개념이 있는데 사실 이게 ga 같은 경우가 웹사이트를 트레킹하는 구조에 있습니다. 그래서 웹사이트 기술이 한계가 있어서 사용자를 구분하는데 쿠키라는 것을 활용하게 되는데요. 이게 쿠키가 기술적인 용어긴 하지만 웹사이트 ga 분석을 하는데 무조건적으로 필요한 개념이니까 알고 넘어가도록 하겠습니다.

그래서 쿠키라는 것을 얘기를 하는데요. 쿠키 그냥 이미지 이렇게 갖고 왔는데 사실 개념이 맞고요 웹사이트에 들어오게 되면 사용자의 정보를 넣어서 웹사이트 서버를 갖고 있는 회사에서 서버에서 이제 웹사이트 브라우저로 사용자에게 직접 어떤 정보를 전달을 하게 됩니다. 그래서 정보가 데이터 파일로 정보가 전달이 되게 되고 파일을 이용해서 서버 웹사이트에 나중에 접속을 하게 되면 개념을 바탕으로 데이터를 분석을 하게 되고 그다음에 사용자로 인식을 하게 됩니다. 그래서 데이터를 바탕으로 유저가 어떤 유저 au bu cu 각각 달랐다는 것을 확인을 하게 되죠. 그래서 히트를 함께 쿠키 아이디가 전달이 되고 쿠키 아이디가 각각 유저마다 다르게 배분이 되기 때문에 유저는 다른 유저라고 판별을 하게 되는 개념이라고 보실 있습니다.

그런데 이제 쿠키에는 문제점이 있습니다. 그래서 제가 아까 브라우저마다 저장이 된다고 말씀드렸잖아요. 그래서 만약에 브라우저가 다르게 이용되거나 아까는 사파리를 이용했고 지금은 인터넷 익스프로를 이용했다고 하면 그거는 이제 다른 유저로 판별이 되게 됩니다. 그래서 ga 쿠키라는 것을 이용해서 사용자를 판별을 하고 있지만 만약에 모바일 그다음에 데스크탑폰 데스크탑 그렇게 해서 다르게 유저 행동을 하게 되면 같은 유저라고 할지라도 이게 다른 유저로 판별이 되게 되는 것이죠. 그래서 지금 보시면 명이 데스크탑 크롬을 이용했고 페이스북 인앱 브라우저 모바일에서는 페이스북 앱을 이용하면 브라우저가 따로 뜨게 되는데요. 페이스북 앱에서 만약에 url 그냥 클릭을 하게 되면 이게 브라우저라는 하나가 페이스북 위에 이렇게 올라오게 됩니다.

 

그게 사실 크롬이랑은 다른 그런 브라우저라고 있는데요. 그래서 페이스북 이넷 브라우저 그래서 여기에도 쿠키가 하나가 배분이 되고요 그다음에 모바일 크롬 모바일 앱에서도 모바일 폰에서 크롬을 앱을 실행시켜서 브라우저를 실행시키게 되면 쿠키가 되게 되고 이렇게 해서 쿠키가 3개나 발생을 시켰잖아요. 그래서 쿠키 3개에 따라서 각각 사용자로 구분이 되게 되는 그런 구조로 되어 있습니다.

그래서 사실 저희가 데이터 분석을 하기 위해서는 사용자가 어떤 행동을 하는지 그걸 분석을 해야 되는 그런 그런 상황에 처해 있는데 사용자가 각각 다른 사용자라고 보면 사용자를 분석하기가 용이하지가 않겠죠. 그래서 지금 사용자 데이터 보안 방법이 있습니다. 그래서 구글 애널리틱스에는 심화 기능 중에 유저 id 세팅이라는 있는데요. 이거를 통해서 이제 사용자를 한꺼번에 묶을 있는 개념이라고 보시면 되겠습니다.

 

그래서 아까 쿠키 별로 아까 말씀드렸던 것처럼 이렇게 1 2 3명의 사용자로 이렇게 잡혔다고 보시면 이거를 이제 유저 아이디 세팅을 통해서 유저로 묶어주는 그런 방법이 있습니다. 그렇지만 부분 자체가 사실 아이디 매칭이라고 보시면 되는데 유저 아이디 로그인 로그인해 유저 아이디어를 각각의 유저 아이디가 있는 있잖아요. 예를 들어서 페이스북 같은 경우도 페이스북 로그인을 하게 되면은 페이스북 아이디가 있는 것처럼 저희 웹사이트에도 만약에 로그인 장치가 있다고 하면은 아이디를 되고 아이디를 이제 예를 들어서 구글 애널리틱스의 그냥 보내셔도 되고요 그다음에 예를 들어서 보안 이슈가 있다고 하시면 이거를 해시화해서 보내셔도 됩니다.

 

똑같은 데이터만 보내주시면 되는데 결국에는 똑같은 데이터를 보내게 되면 명의 id 인식을 하게 되고 그게 명의 사용자가 되는 것이죠. 대신에 쿠키를 가지고 있을 각각 로그인을 번씩 해야 되고요 그런 문제점이 있어서 사실 로그인 유저만 판별 가능하다는 그런 단점이 있고요 그다음에 개발자의 도움 사실 아이디를 넣어주는 자체도 이게 저희가 쉽게 있는 부분은 아니고 로그인 과정이 있다고 하면 아이디를 db에서 꺼내서 ga 계정으로 보내주는 그런 작업을 개발자가 도와주셔야 됩니다. 그래서 부분은 만약에 매칭을 해서 데이터를 조금 정밀하게 보고 싶으신 경우 개발자에게 요청을 해주시면 되겠습니다.

728x90
반응형

댓글