< HomePage | Снимки
<- Вторник, 15 Февруари 2005 | Начална страница | Четвъртък, 17 Февруари 2005 ->
Сряда, 16 Февруари 2005
15:50

Забавно е когато откриваш къде хората са пуснали връзка към твоят сайт. През няколко дни си преглеждам логовете на уеб сървъра и за целта съм си направил един много грозен шел скрипт. Може на някой да му е полезен затова го публикувам тук с малко обяснения към него. Ето го и скрипта:

#!/bin/sh

clear
grep -v -E "jpg|png|ico" access.log | \
   awk '{print $11}' | \
   sort | uniq -c | \
   grep -v -E "georgi.unixsol.org|google|linux-bg|yahoo" | \
   sed -e 's,",,g' | \
   sort -n | less

Какво всъщност прави тази идиотщина по-горе. Претърсва файла access.log, в който apache уеб сървъра ми записва посещенията на сайта. При мен този файл всеки ден е в различна директория именувана според датата.

Премахва зареждането на картинки (grep -v -E "jpg|png|ico"), тъй като връзките към тях не ме вълнуват, след което взима единайстата колона във файла (awk '{print $11}'). В нея е записано полето referer, което браузърите изпращат, когато кликнете върху някоя връзка на страница.

След което сортира referer-ите и оставя само уникалните, като пред тях слага, колко пъти дадена връзка се е срещала (sort | uniq -c).

С grep -v премахвам referer-ите от разни сайтове, който не ме вълнуват, след което изрязвам кавичките и накрая сортирам по брой. Така получавам един хубав списък от кои сайтове, хората идват при мен.

Самият скрипт съм го кръстил rf и си го държа в домашната директория. Когато тръгна да разглеждам логовете, просто влизам в директорията където е лога за деня и стартирам ~/rf.

Това е силата на Unix - "операционна система базирана на текстообработка".

[ Коментари: 2 ]
Коментари

Приятно нещо, да ;) Аз имам такова в самия ми блог. Знам, че си "за" минималистичните неща, като става дума за раздуване на блогове, но идейка: може да сложиш изхода от такъв скрипт и ти на страницата си.
Всъщност единствената полза и разлика с това да си го гледаш сам е, че и ние можем да го виждаме и да се радваме на интересните препращания ;)) ;Р

Написа turin (www) на 16-Feb-2005 18:39


Не искам да го сложа, за да избегна налитащите спамери, който дори в момента се пробват да правят referer spam.

Написа Георги Чорбаджийски (www) на 16-Feb-2005 18:42


Valid XHTML 1.0! Valid CSS!