20 mars 2006

340 Mo de posts

La transformation du forum en pages HTML pèse environ 580 Mo. Dont 340 Mo de fichiers HTML vraiment issus du forum. Le reste, c'est 230 Mo de merde récupérée sur d'autres sites (principalement des images intégrées dans les posts).

Les 340 Mo de posts sont répartis dans environ 4800 fichiers HTML. Ce qui est marrant, c'est que je viens de m'apercevoir que tous les posts sont en 6 exemplaires. Il restait donc des liens parasites dans le code de départ.

Je vais essayer de les identifier, ensuite je les éliminerai sans pitié, puis je recommencerai la capture, et cette fois-ci ça devrait être bon.

J'essaye de faire en sorte que l'ensemble (site et extraction du forum) tienne sur un CD sans compression, afin que la consultation puisse se faire directement depuis le CD.

1 commentaire:

Anonyme a dit…

ça a l'air d'être une pure galere ces forums php quand il s'agit de les mettre hors ligne.