Ces temps on enterre des sites SPIP. Dommage, c’était bullet proof mais devant à la facilité d’emploi de WordPress…
Enfin bon, quand on travaille sur le renouvellement d’un site web, il ne faut pas seulement penser à ce qui va venir, il faut aussi –souvent– conserver le passé.
En bref: une solution économique pour disposer de tout le contenu de l’ancien site sur le nouveau. Et il y a souvent pas mal de contenu! Oublions toute approche au niveau des bases de données.
Nous proposons de figer le site sous forme de pages html statiques. C’est vite fait et efficace à ~95% en utilisant l’outil wget avec des commandes comme:
wget –mirror –page-requisites –convert-links –html-extension –restrict-file-names=unix –exclude-directories= »ecrire/ » –reject= »*edit » –domains= »monanciensite.me » –no-parent –directory-prefix= »archive.monanciensite.me » -e robots=off www.monanciensite.me
L’option la plus exotique est ‘-e robots=off’ qui permet de passer outre les limitations sur les robots et de récupérer plus d’infos.
Et les options –exclude-directories= »ecrire/ » et –reject= »*edit » sont propres à la technologie spip de l’ancien site.
Les 5% restants ont nécessité des collectes (toujours via wget) et des modifications manuelles pour récupérer (images, contenu de requêtes XML Ajax) et adapter des fichiers (url, en-têtes XML) liés à javascript et non gérés par wget.