4.4.트래픽과 로그인 분석
4.4.1.인터넷 교통량 트래픽의 의미와 트래픽 제한 이유
웹호스팅 업체는 웹호스팅 상품에 트래픽 제한을 둡니다.
웹호스팅 서비스를 제공하는 업체는 대부분 사용자에게 트래픽 제한을 둔 상품을 판매합니다. 이때 제한을 두는 방향은 크게 세 가지입니다.
1. 전송량 트래픽 제한
2. 서버 부하 제한
3. 접속자 수 제한
트래픽(traffic)은 이름 그대로 교통량입니다. 인터넷을 통해 주고받는 자료의 양이라고 보면 됩니다. 때로는 차에 실린 화물이라는 의미로 부하라는 말을 사용하기도 합니다.
트래픽은 서버 부하와 회선 부하로 구분합니다.
트래픽은 크게 두 단계로 나눌 수 있습니다. 첫 번째 단계는 서버의 하드디스크에서 필요한 자료를 꺼낼 때의 부하입니다. 이때 서버가 CPU가 많은 일을 하게 되는데 이를 서버 부하라고 말합니다. 두 번째 단계는 서버에서 꺼낸 자료를 사용자의 PC에 전송하는 단계입니다. 즉 전용선을 통해 전송하는 단계입니다. 이것을 회선 부하 또는 회선 트래픽이라고 말합니다. 일반적으로 말할 때의 트래픽은 회선 트래픽을 말합니다. 그리고 총 트래픽이라고 말하면 서버 부하와 회선 트래픽을 합쳐서 말하는 겁니다.
그리고 특별한 의미 없이 서버 트래픽이라고 말하면 서버에 발생하는 트래픽 즉, 서버 부하를 말하고 전송 트래픽, 회선 트래픽이라면 전송 과정에 발생하는 회선 용량에 걸리는 부하를 말합니다.

**사진: 웹호스팅 홈페이지의 트래픽을 보여주는 그래프
트래픽이 많이 걸리면 서버가 느려지거나 먹통이 됩니다.
트래픽 또는 부하가 많이 걸릴 경우 서버는 처리 속도가 크게 느려지거나 심할 경우 먹통(다운)이 됩니다. 수치 계산하는 일이 어렵습니다만 예를 들기 위해 간단하게 수치를 계산하겠습니다.
보통 웹호스팅에 많이 사용하는 2M급의 회선인 E1 회선의 경우 전송 속도가 2Mbps(=2048Kbps)입니다. 즉 1초에 2메가비트를 전송하는 것입니다. 따라서 이 회선으로 하루에 전송할 수 있는 자료의 양은 다음과 같습니다.
[보기] E1 회선의 하루 전송량
2Mbps*3600(초)*24(시간) = 172800Mbps = 21600Mbyte = 21Gbyte
대략 21GByte를 전송할 수 있는 속도입니다. 그러나 이것은 이론상의 최대 수치입니다. 실제로는 효율성을 감안할 때 이보다 20~40% 정도 적은 효율성을 보입니다. 즉 하루에 10~15Gbyte 정도가 가장 효율적이라는 뜻입니다.
웹호스팅 하나 당 배정할 수 있는 트래픽의 양은 매우 적습니다.
보통 서버 하나에 웹호스팅을 300개 정도 설치하는데, 만약 하나의 서버에 E1 회선이 연결되어 있고 이 서버에 300개의 웹호스팅이 물려있다면 각 호스팅에 균등하게 배정할 수 있는 전송 트래픽은 0.03~0.05Gbyte 즉, 약 30~50MByte에 불과합니다.
이 때문에 웹호스팅 업체에서 웹호스팅 서비스에 전송량 제한을 두는 것입니다. 만약 전송량 제한을 두지 않는다면 E1 회선 하나는 몇 개의 호스팅조차 감당하기 힘들 겁니다. 요즘 DVD 영화의 경우 600M~1GByte 정도 되는데 이런 동영상 20편만 다운로드 받아가도 서버가 전송량 부하로 인해 다운될 확률이 높습니다. 그래서 동영상 자료실처럼 서버에 부하를 많이 주는 홈페이지 개설을 제한하는 겁니다.
회선 용량에 제한이 있기 때문에 발생하는 전송 트래픽은 주로 덩치가 큰 파일을 받아갈 때 쉽게 발생합니다. 조금 전에 계산한 것처럼 E1급 회선의 경우 이론상으로도 최대 전송량이 20GByte에 불과하기 때문에 DVD 동영상 20개 정도만 받아가면 하루 전송량이 차버립니다.
서버 부하는 잘못된 CGI 프로그램이 원인인 경우가 많습니다.
이에 비해 서버 부하(서버 트래픽)는 서버의 CPU나 메모리를 많이 혹사시키는 프로그램에 의해 발생합니다. 주로 CGI 프로그램이 CPU와 램을 많이 혹사시키는 프로그램입니다. 그리고 잘못 만들어진 CGI는 무한 맴돌이(loop)에 빠질 수 있는데 무한 맴돌이에 빠질 경우 CPU 점유율이 거의 100% 가까이 올라갈 수 있습니다. 이런 경우에는 물론 서버가 먹통이 됩니다.
특히 CPU 점유율이 10%를 넘기면 메일 서버가 제대로 동작하지 않는 경우가 발생합니다. 그래서 최근에는 전송 트래픽 제한 외에도 CPU와 메모리 점유율도 제한을 두고 웹호스팅 신청을 받는 겁니다.
따라서 자신의 홈페이지에 접속자 수가 많거나 기타 이유로 서버 부하나 전송 트래픽이 많을 경우에는 좀더 많은 트래픽을 제공받는 웹호스팅으로 옮겨야 합니다. 그렇지 않으면 트래픽 제한에 걸리게 됩니다.
자료가 많은 홈페이지는 트래픽 관리에 신경 써야 합니다.
즉 자신의 홈페이지 전송 트래픽이 200MByte인 경우 200MByte가 넘는 전송량을 기록하면 홈페이지 접속이 차단됩니다. 홈페이지 접속이 차단되는 사태를 막으려면 평소에 트래픽 증가 추세를 잘 보고 트래픽 관리를 하는 수밖에 없습니다.

**사진: 동영상이나 자료 위주의 홈페이지는 트래픽 관리에 관심을 가져야 합니다.
접속자 수는 데몬 부하 때문에 둡니다. 이것은 서버에 접속하는 접속자 수가 많을 경우 웹 Daemon 이 많이 뜨면서 발생하는 부하로 동시 접속자의 수를 제한함으로써 해결합니다. 대개의 경우 리눅스 서버는 하루에 약 5만 명 정도가 속도의 저하 없이 정상적으로 접속할 수 있는 숫자로 보고 있습니다. 즉 하루에 5만 명 이상이 접속하거나 동시에 수 많은 사용자가 접속할 경우에는 서버의 처리 속도가 크게 느려지거나 서버 접속이 차단될 수 있습니다. 그래서 하루에 접속할 수 있는 사용자 수를 제한하는 것입니다.
4.4.2.트래픽 계산 방법
트래픽은 사용자가 읽은 문서의 총 용량입니다.
트래픽을 계산하는 방법은 간단합니다. 사용자들이 읽은 문서의 총 용량을 계산하면 됩니다. 사용자들이 자신의 홈페이지에 접속해 문서를 읽는다는 뜻은 곧 자신의 홈페이지 서버에서 사용자 컴퓨터로 자료를 전송했다는 뜻입니다.
예를 들어 사용자들이 홈페이지에 접속했을 때 처음 보는 문서인 index.html을 예로 들겠습니다.
index.html 파일의 크기는 2Kbyte에 불과합니다. 그런데 이 문서에서 사용하는 그림 파일이 10개 정도 있고 이 그림 파일의 크기를 모두 합치면 100Kbyte입니다. 이럴 경우 사용자들이 index.html 문서를 보기 위해서는 index.html 문서와 함께 10개의 그림 파일을 전송해주어야 합니다. 그러므로 곧 102Kbyte의 용량을 홈페이지 접속자에게 전송해야 합니다.

**사진: 히트 수에 파일의 용량을 곱하면 트래픽이 계산됩니다.
일단 한 번 전송한 index.html과 10개의 그림 파일은 사용자의 PC에 캐시 상태로 저장됩니다. 때문에 사용자가 다시 index.html 문서를 선택하더라도 서버에서 사용자 PC로 재전송하지 않습니다. 사용자가 다시 index.html 문서를 선택했을 때 브라우저는 조금전에 전송받아 캐시 메모리에 저장한 index.html 문서를 보여줍니다. 브라우저의 '새로 고침' 단추를 누르기 전에는 브라우저가 조금 전에 본 index.html 문서의 재전송을 서버에 요구하지 않습니다.
하여간 index.html 문서만 보고 다른 사이트로 이동한다 해도 한 사용자가 접속하는 순간 102Kbyte의 전송량 부하가 생깁니다. 이런 사용자가 하루 1천 명만 되면 102Mbyte의 부하가 생기는 셈이죠.
그런데 대부분의 사용자는 index.html 문서만 보고 다른 곳으로 가지 않습니다. 각종 메뉴를 뒤져보고 파일을 다운로드 받아가기도 합니다. 이런 식으로 사용자 한 명이 내 홈페이지에 접속해서 1Mbyte 정도의 자료를 전송받는다면 하루에 100명만 접속해도 전송 트래픽이 100Mbyte에 달하는 셈입니다.
물론 크기가 100Mbyte인 동영상을 올려놓고 사용자가 받아가게 한다면 1명이 접속해 1번만 받아가도 100Mbyte의 전송 트래픽이 발생하는 셈입니다.

**사진: 천리안 방송국처럼 자료실 위주의 홈페이지라면 트래픽이 많이 걸립니다.
자료실 위주로 홈페이지를 운영하면 트래픽이 많이 걸립니다.
따라서 텍스트 문서 위주로 홈페이지를 운영할 때는 트래픽 제한이 별 것 아닌 것처럼 보이지만 약간 덩치가 큰 파일을 받아가거나 동영상 파일 위주로 홈페이지를 운영한다면 순식간에 전송 트래픽 양이 불어납니다.
대개의 경우 트래픽 양은 하드디스크 양과 비슷하게 배정해줍니다. 즉 200Mbyte의 하드디스크를 배정받으면 트래픽 양도 200Mbyte 근처입니다. 많이 준다고 해도 100~500Mbyte인 경우가 대부분입니다. 그런데 이 정도의 트래픽 양으로 제한된 홈페이지에 100Mbyte 용량의 동영상을 올려놓고 받아가게 한다면 둘과 몇 사람만 동영상을 받아가도 트래픽 제한에 걸려 홈페이지 접속이 차단됩니다.
따라서 홈페이지를 운영할 때는 트래픽 문제를 충분하게 고려해야 합니다. 만약 트래픽이 많이 발생하는 홈페이지를 운영해야 한다면 트래픽을 많이 주는 웹호스팅을 신청해야 합니다. 또는 덩치가 큰 파일을 트래픽 제한이 없거나 비어있는 다른 사이트에 올려놓고 링크를 거는 방법을 사용해야 합니다.
4.4.3.방문자 수와 히트 수, 페이지 뷰
방문자 수보다는 전송 트래픽 위주로 조건을 제시합니다.
방문자수는 홈페이지를 방문한 사람의 수를 말합니다. 하루 100명이 접속했다면 방문자 수는 100이 됩니다. 업체에 따라서는 방문자 수를 웹호스팅 제한 조건에 포함하지 않는 경우가 많습니다. 왜냐하면 대개의 경우 방문자 수보다는 전송 트래픽으로 충분하게 트래픽 제한이 가능하기 때문입니다. 사실 방문자 수가 많으면 그만큼 전송 트래픽 양도 비례하여 많아집니다. 따라서 전송 트래픽만 제한해도 저절도 방문자 수가 제한되는 셈입니다.
그리고 서버에 무리를 주는 것은 대부분 전송 트래픽이지 방문자 수가 아닙니다. 동시에 100명이 접속해 글로 된 문서 파일을 읽는 것보다는 단 10명이 접속해 1Gbyte 용량의 동영상 파일을 다운로드 받는 것이 서버 측에는 큰 무리가 갑니다. 그래서 전송량 위주로 트래픽을 제한하는 것입니다.

**사진: help119.com의 트래픽 제한은 300Mbyte입니다.
히트수는 노출된 파일의 갯수를 말합니다.
로그인 분석을 하거나 사이트의 인기도를 측정하는 기준의 하나로 방문자 수와 함께 히트 수라는 말을 씁니다. 히트 수는 그 방문자에게 노출된 파일의 갯수를 말합니다. 다시 말해 방문자가 본 파일의 수량입니다.
예를 들어 한 방문자가 index.html 문서만 보고 다른 사이트로 이동했다고 합시다. 이때 index.html 문서를 보기 위해서는 10개의 그림 파일이 필요합니다. 그렇다면 이 방문자는 index.html 문서 하나와 10개의 그림 파일을 본 셈입니다. 총 11개의 파일을 보고 다른 사이트로 이동한 것이죠. 이 경우 방문자 수는 1이지만 히트 수는 11이 됩니다.
사이트의 인기를 평가할 때는 보통 방문자 수를 기준으로 삼거나 히트 수를 기준으로 삼습니다. 트래픽은 인기 평가 기준이 아닙니다. 홈페이지 성격에 따라서 단 열 명이 방문해도 엄청난 트래픽이 걸릴 수 있는 반면 1만 명이 방문해도 트래픽의 양은 매우 적을 수 있기 때문입니다.

**사진: 일별 히트 수 분석 결과를 보여주는 프로그램
히트 수는 허수가 증가하는 문제점이 있습니다.
그러나 방문자 수나 히트 수로는 사이트의 인기도 평가가 미흡합니다. 그래서 나온 것이 페이지 뷰(page view)라는 개념입니다. 요즘 광고료를 산정할 때는 페이지 뷰를 기준으로 책정합니다. 그 까닭은 히트 수의 경우 광고 노출을 평가하는데 문제점이 있기 때문입니다.
예를 들어 하나의 문서에 하나의 배너나 링크만 걸리면 이 문서의 히트 수는 2에 불과합니다. 반면 하나의 문서에 20개의 배너 광고나 링크가 걸리면 히트 수는 20으로 열 배나 불어납니다. 사용자는 똑 같은 문서를 볼 뿐인데도 링크된 파일이 많으면 히트 수가 몇 배씩 커지는 문제가 생기는 것입니다. 이런 경우 히트 수는 커지지만 오히려 광고 효과는 배너가 한 개만 걸릴 때보다 떨어집니다. 따라서 히트 수를 기준으로 광고료를 책정한다면 해당 사이트는 문서에 노출되는 파일을 많이 만들어 히트 수만 향상시키려 할 것이고 광고 효과는 히트 수에 반비례로 떨어지는 문제가 발생합니다. 이처럼 히트 수는 링크가 많을수록 히트 수가 많아지는 단점이 있어 잘 사용하지 않는 개념이 되었습니다.
페이지 뷰는 방문자가 본 문서의 페이지 수를 뜻합니다.
페이지 뷰는 방문자가 본 문서의 페이지 수를 뜻합니다. 10명의 방문자가 평균 9개의 문서를 봤다면 90개의 페이지 뷰가 기록되는 셈입니다. 알렉사 등의 사이트 평가 기관에서 인기 사이트를 평가할 때는 페이지 뷰를 기준으로 삼을 정도로 페이지 뷰는 실질적인 인기 측정의 기준입니다.

**사진: 페이지 뷰 결과를 분석한 화면
그러나 최근에는 페이지 뷰 숫자보다는 페이지당 열람 시간을 비롯한 보조적인 수치에 대한 평가도 강화되고 있습니다. 열 명이 다섯 페이지를 10초 동안 보면 페이지 뷰는 50이 되지만 노출 시간은 500초로 광고 효과는 크지 않습니다. 반면 다섯 명이 다섯 페이지를 100초 동안 볼 경우 페이지 뷰는 25에 불과하지만 노출 시간은 2,500초로 광고 효과는 더 큽니다.
때문에 요즘은 사이트 인기 측정 기준으로 다양한 기준을 종합적으로 적용합니다. 방문자 수와 히트 수는 물론이고, 페이지 뷰, 페이지 열람 시간, 방문자의 평균 머무는 시간 등을 종합적으로 고려해 인기를 평가합니다.
4.4.4.로그인 분석의 의미
인터넷 사이트의 경우 사용자 방문을 로그인으로 표현합니다.
로그인(log in)은 멀티 유저용 컴퓨터나 서버에 자신의 ID를 입력하고 접속하는 과정을 말합니다. 또는 인터넷 사이트나 회원제 사이트에 ID와 비밀번호를 입력하고 접속하는 것을 뜻합니다. 웹호스팅에서 로그인이라고 하면 호스팅을 받는 홈페이지에 사용자들이 접속하는 일을 말합니다. 회원제 사이트처럼 회원ID와 비밀번호를 입력하는 과정이 없더라도 한 명의 사용자(방문자)가 사이트에 접속했다면 로그인했다고 표현합니다.

**사진: 홈페이지 사용 내용을 시간대 별로 보여주는 화면
로그인 분석은 홈페이지 방문자에 대한 정보를 분석하는 일입니다.
로그인 분석은 이렇게 사이트에 접속한 사용자가 무슨 일을 했는지 알아보고 분석하는 일을 뜻합니다. 즉 내 홈페이지에 접속한 사용자가 몇 명이나 되며 주로 어떤 문서를 보고 갔으며 평균적으로 머무른 시간은 몇 분이며, 트래픽은 얼마나 사용했는지 등등을 분석하는 일입니다.
로그인 분석은 홈페이지를 발전적으로 만드는데 매우 중요한 역할을 합니다. 로그인 분석만 세밀하게 잘 이루어지면 홈페이지를 좀더 인기 있는 홈페이지로 만들 수 있고, 돈도 더 많이 벌 수 있습니다.
A라는 기업을 예로 들겠습니다. 이 기업에서 로그인 내용을 분석해본 결과 30대는 주로 밤 10시에서 12 사이에 사이트에 접속하고 10대는 6시에서 8시 사예 접속하는 것으로 분석됐습니다. 그렇다면 저녁 6~8시 사이에는 10대들이 좋아할 기사와 제품으로 광고를 띄우는 것이 좋습니다. 그리고 밤 10시에서 자정 사이에는 30대들이 좋아할 제품으로 광고를 띄워야 매출이 더 올라갑니다. 만약 로그인 분석이 없이 아무렇게나 광고를 띄운다면 10대 접속 시간에 30대 선호 품목으로 광고를 띄우는 어리석은 일을 저지르게 됩니다. 이렇게 되면 제품이 팔릴 까닭이 없죠.
그래서 로그인 분석은 매우 중요합니다. 쇼핑몰이라면 로그인 분석만으로도 수익성을 배 이상 끌어올릴 수 있습니다.

**사진: 요일 별 방문자 분석 화면
인기 있는 사이트로 만들고 싶다면 로그인 분석에 힘 써야 합니다.
웹호스팅을 사용할 경우 로그인 분석이 어렵습니다. 로그인 분석을 서비스해주는 웹호스팅 업체가 많지 않을 뿐더러 대개는 유료로 제공하는 서비스이기 때문입니다. 그나마 회원 정보를 바탕으로 한 로그인 분석이 아니고 간단한 트래픽 정보에 불과합니다.
그렇지만 트래픽 분석 내용만으로도 좀더 인기 있는 홈페이지로 만드는 데는 도움이 됩니다. 예를 들어 카페24에서는 웹호스팅 사용자에게 무료로 로그인 분석을 해주는데 꽤 자세한 내용까지 분석이 됩니다. 특히 히트 수와 상위 URL 등의 내용을 통해 사용자들이 가장 많이 본 파일을 한 눈에 파악할 수 있습니다. 따라서 사용자들이 좋아하는 콘텐츠가 어떤 것인지 알 수 있습니다. 결국 로그인 분석을 이를 통해 사용자들이 좋아하는 분야의 콘텐츠를 늘리면 인기 있는 사이트로 발전할 수 있습니다.
로그인 분석 내용은 상세할수록 좋지만 간단한 정보라도 없는 것보다는 좋습니다. 인기 있는 문서가 무엇인지 파악할 수 있다면 해당 분야의 콘텐츠에 집중해 더욱 많은 사용자가 찾는 사이트로 만들 수 있습니다. 따라서 좋은 홈페이지로 만들 욕심이 있다면 로그인 분석에 많은 관심과 연구를 기울여야 합니다.

**사진: 웹호스팅 업체의 로그인 분석 차림을 활용하면 사이트 인기 향상에 도움이 됩니다.
[2마당. 인터넷 이야기]