The Diary
Дневникът на Георги
<- Вторник, 15 Февруари 2005 | Начална страница | Четвъртък, 17 Февруари 2005 ->
Сряда, 16 Февруари 2005
15:50Забавно е когато откриваш къде хората са пуснали връзка към твоят сайт.
През няколко дни си преглеждам логовете на уеб сървъра и за целта съм
си направил един много грозен шел скрипт. Може на някой да му е полезен
затова го публикувам тук с малко обяснения към него. Ето го и скрипта:
#!/bin/sh
clear
grep -v -E "jpg|png|ico" access.log | \
awk '{print $11}' | \
sort | uniq -c | \
grep -v -E "georgi.unixsol.org|google|linux-bg|yahoo" | \
sed -e 's,",,g' | \
sort -n | less
Какво всъщност прави тази идиотщина по-горе. Претърсва файла access.log, в който apache уеб сървъра ми записва посещенията на сайта. При мен този файл всеки ден е в различна директория именувана според датата.
Премахва зареждането на картинки (grep -v -E "jpg|png|ico"), тъй като връзките към тях не ме вълнуват, след което взима единайстата колона във файла (awk '{print $11}'). В нея е записано полето referer, което браузърите изпращат, когато кликнете върху някоя връзка на страница.
След което сортира referer-ите и оставя само уникалните, като пред тях слага, колко пъти дадена връзка се е срещала (sort | uniq -c).
С grep -v премахвам referer-ите от разни сайтове, който не ме вълнуват, след което изрязвам кавичките и накрая сортирам по брой. Така получавам един хубав списък от кои сайтове, хората идват при мен.
Самият скрипт съм го кръстил rf и си го държа в домашната директория. Когато тръгна да разглеждам логовете, просто влизам в директорията където е лога за деня и стартирам ~/rf.
Това е силата на Unix - "операционна система базирана на текстообработка".
[ Коментари: 2 ]Коментари
Не искам да го сложа, за да избегна налитащите спамери, който дори в момента се пробват да правят referer spam.
Disclaimer: Except where otherwise noted all opinions expressed here are personal
opinions of the author and do not reflect official opinions of my employer or
any other person, company or organization associated with the author.
Copyright: Except where otherwise noted the content of this site is licensed under a
Creative Commons Attribution License. Текстът на договора за ползване на български
Copyright (cc) 2003-2011 Georgi Chorbadzhiyski. Some rights reserved.
Comments, texts and pictures not signed by me are property of their respective owners.
Страницата е генерирана от Glog v3.99-test
Приятно нещо, да ;) Аз имам такова в самия ми блог. Знам, че си "за" минималистичните неща, като става дума за раздуване на блогове, но идейка: може да сложиш изхода от такъв скрипт и ти на страницата си.
Всъщност единствената полза и разлика с това да си го гледаш сам е, че и ние можем да го виждаме и да се радваме на интересните препращания ;)) ;Р
Написа turin (www) на 16-Feb-2005 16:39