Je ne sais pas si comme moi vous regardez de temps en temps les log fournis par legtux: c'est assez pénible à lire dans un éditeur de texte. J'ai donc fait un petit script php, que je partage avec vous, car si il me sera utile, j'espère que vous en profiterez aussi !
Il est tout simple, et affiche les résultats sous forme de tableau. Il suffit de mettre le fichier log dans le même dossier que le fichier php, et de renommer le fichier log log.log (ou changer le nom dans le fichier php).
Je ne sais pas si ca sera utile à quelqu'un mais autant ne pas l'avoir fait pour rien
$matches = array (
0 => legtux.org:80 157.55.35.102 - - [22/Jul/2013:00:45:18 +0200] "GET /robots.txt HTTP/1.1" 302 221 "-" "Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)"',
1 => 'legtux.org', //Nom de domaine
2 => '80', //Port utiliser ( ou 443 pour le ssl si logger)
3 => '157.55.35.102', // IP du visiteur
4 => '35.', //Ne pas tenir compte
5 => '102',//Ne pas tenir compte
6 => '22/Jul/2013', //Date
7 => '00:45:18', //Heure
8 => '45:',//Ne pas tenir compte
9 => '18',//Ne pas tenir compte
10 => 'GET',//Method GET ou POST
11 => 'robots.txt', //URL
12 => '302', //Code HTTP de la requete
13 => '221', //Taille de la page demander
14 => 'Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)', //navigateur
)
Je ne connaissais pas AwStats et j'avoue ne pas avoir beaucoup cherché avant de créer le code... AwStats propose t-il quelque chose de plus ?
En revanche ta regex est assez intéressante, je te laisse l'implanter sur le bout de code que j'ai écrit, je pense que cela compensera toutes les erreurs et manques que j'ai eu la flemme de traiter :p