icône déjà dup

Sauvegarde

En informatique, la sauvegarde (backup en anglais) est l'opération qui consiste à dupliquer et à mettre en sécurité ses données personnelles et / ou celles de son système informatique.

Tous les supports matériels de stockage ont une durée de vie limitée. Pour un ordre d'idée très relatif on estime que l'espérance de vie moyenne d'un disque dur en usage courant est d'environ 6 ans et celle d'un SSD aux alentours de 8 ans.1)
En plus de l'usure courante, la perte de données peut être due à une erreur de manipulation, un logiciel malveillant, un vol, un accident (choc, inondation, incendie …).
Pour peu que l'on possède des données personnelles numériques, il est donc indispensable d'effectuer des sauvegardes régulières sans quoi la question n'est pas de savoir si, mais quand on perdra ses précieux documents, photos, travaux informatiques, etc.

Il existe de nombreuses applications de sauvegarde qui peuvent nous aider dans cette tâche qui peut sembler rébarbative. Sur Ubuntu c'est l'application Déjà Dup qui est installée par défaut, et elle convient parfaitement dans la majorité des cas.

En fonction de ses besoins il peut cependant être intéressant de se pencher sur une alternative.

Évaluer ses besoins

Les besoins en terme de sauvegarde sont très variés et dépendent

  • de l'utilisateur : particulier, entreprise, etc.
  • de la sensibilité des données : familiales (photos, vidéos, etc.), secrets d'entreprise, etc.

Dans chaque cas les solutions ne seront pas les mêmes. Voici quelques pistes pour faire cette évaluation :

  • que doit-on sauvegarder ? Quelles sont les données auxquelles on tient ? Imaginer que son disque dur tombe en panne pour se mettre en situation.
  • selon le degré d'importance et d'activité, à quelle(s) fréquence(s) et à quels moments souhaite-t-on lancer les sauvegardes ? On peut imaginer plusieurs niveaux de fréquence (ex. : les photos une fois par semaine, les travaux tous les jours…)
  • sur quel(s) support(s) ? Cela dépend du volume à sauvegarder et des ressources à disposition (disque dur externe, NAS, service cloud, etc.)
  • souhaite-on conserver les anciennes versions des fichiers sauvegardés, puis modifiés ou supprimés ? Combien de temps ? (cf. versioning dans le petit glossaire)

Emplacement de sauvegarde

Pour des raisons évidentes, la sauvegarde d'une machine effectuée sur elle-même (même sur un autre support interne) n'a aucune valeur. Elle ne résistera pas à la plupart des événements susceptibles de compromettre les données qui y sont stockées.

Idéalement une bonne sauvegarde doit être distante. On peut éventuellement sauvegarder sur des disques externes soigneusement stockés, mais ils faut vérifier régulièrement leur bon fonctionnement (comme au moment des sauvegardes, elles aussi régulières).
L'idéal est de sauvegarder sur un site tout autre en profitant d'Internet. On peut passer par un service de cloud (attention à votre vie privée, le chiffrement peut aider), ou procéder à un échange de bon procédé avec la familles ou les ami·e·s, à l'aide d'un NAS ou d'un simple disque externe connecté à une box internet.

Quelles données sauvegarder ?

Sauvegarder son répertoire personnel

Comme il est possible de changer l'emplacement de stockage des données utilisateur, assurez-vous de sauvegarder le bon emplacement de stockage !

Le plus important est évidemment vos travaux, documents et médias personnels. Ce sont les seuls qui soient souvent irremplaçables. Si vous utilisez Ubuntu tel qu'il est pensé avec ses réglages par défaut, toutes ses données se trouvent en principe dans votre répertoire personnel /home/$USER (où $USER est votre nom d'utilisateur).
Vous pouvez les sauvegarder sans permission particulière (autre que les droits en écriture sur le stockage destinataire).

Ce répertoire contient aussi vos réglages personnels pour chaque application, comme votre profil de navigateur web.

Si vous n'êtes pas seul(e) à utiliser cette machine, les données des autres utilisateurs se trouvent aussi dans leurs sous-répertoires de /home/ respectifs. Vous aurez dans ce cas besoin des permissions super-utilisateur pour y accéder et les sauvegarder.

Sauvegarder la liste des paquets (logiciels) installés

Lors d'une migration (vers un nouvel ordinateur) il peut aussi être intéressant de sauvegarder la liste des logiciels installés, pour les redéployer plus facilement sur votre prochaine installation.

Consulter le tutoriel Sauvegarde et restauration de la liste des paquets installés pour restauration, duplication ou migration.

Sauvegarde complète du système

Enfin il peut être utile de sauvegarder le système d'exploitation dans son intégralité.

Cela peut-être utile en particulier quand on modifie le système sans être assuré·e des opérations entreprises, ou qu'on a l'habitude (mauvaise) de copier-coller des lignes de commande trouvées sur Internet sans bien les comprendre.
Mais pour ces cas de figure on utilisera plus facilement des points de restauration (ou "instantanés", ou "snapshots"), analogues au TimeMachine de MacOs. Ils permettent de restaurer un système devenu instable, avec tous les logiciels installés. Le logiciel Timeshift permet par exemple de gérer ceci simplement. Il ne s'agit cependant pas vraiment de sauvegarde car les instantanés se font sur le même support que le système.

Une vraie sauvegarde du système sur un stockage externe peut quant à elle s'avérer très utile simplement pour restaurer en une fois le système sur une même machine quand le support de stockage a failli, afin de s'économiser le temps d'une réinstallation et d'une personnalisation.
Elle a aussi son importance dans le domaine des serveurs, ou d'une manière générale lorsqu'on a apporté de nombreuses modifications au système en général (services, règles de pare-feu, etc.).

Voir aussi Réinstallation à l'identique.

Petit glossaire

  • Sauvegarde complète : tous les fichiers sont sauvegardés sans tenir compte d'une sauvegarde antérieure.
  • Sauvegarde différentielle : on ne sauvegarde que ce qui a changé depuis la dernière sauvegarde complète. Ainsi, pour tout restaurer, il suffit de restaurer la sauvegarde complète puis la dernière différentielle.
  • Sauvegarde incrémentielle (incremental en anglais) : on ne sauvegarde que ce qui a changé depuis la dernière sauvegarde quelle qu'elle soit (complète, différentielle ou incrémentielle). La plupart des logiciels dédiés à la sauvegarde gèrent les sauvegardes incrémentielles. Ainsi, pour tout restaurer, il faut restaurer la dernière sauvegarde complète puis toutes les sauvegardes incrémentielles effectuées depuis, et dans l'ordre.
  • Sauvegarde décrémentielle (decremental) : on ne sauvegarde que ce qui a changé depuis la dernière sauvegarde mais à l'inverse de la sauvegarde incrémentielle, c'est la sauvegarde la plus récente qui est complète, les plus anciennes sont des différences par rapport à la sauvegarde suivante. Pour tout restaurer il suffit d'utiliser la dernière sauvegarde, mais on conserve l'historique pour récupérer même longtemps après un fichier qui aurait été effacé par erreur.
  • Compression : la compression accélère les transferts via Internet et permet aux sauvegardes d'occuper un minimum d'espace sur leur support final.
  • Déduplication : la déduplication a le même effet que la compression en supprimant les contenus en double côté dépôt de sauvegarde, où qu'ils se trouvent, de manière automatique et transparente pour l'utilisateur.
  • Versioning ou Gestion de versions : conservation des fichiers et de leurs anciennes versions, après modification ou suppression. De nombreux logiciels de sauvegardes permettent de restaurer différents états d'un espace de stockage, avec ses répertoires et ses fichiers. On parle alors d'instantanés ou snapshots. On peut alors choisir la durée de rétention de chaque instantané (correspondant à une sauvegarde). Les logiciels permettent de profiter de cette fonctionnalité en évitant de dupliquer les fichiers inchangés, afin d'économiser au mieux l'espace de stockage.

Applications

Les outils de synchronisation ne permettent pas de sauvegarder ses données de manière simple et fiable.
La synchronisation, à plus forte raison automatisée, n'est pas de la sauvegarde !

Une erreur d'un côté (suppression ou modification) sera directement reportée de l'autre.

Légende des tableaux ci-dessous :

Supporté Non supporté Possible après quelques réglages Non testé
Supporté Non supporté Possible après quelques réglages Non testé

Interfaces graphiques

Nom utilise (Back-end) Incrémental Planification Restauration incorporée Points forts Points faibles Remarques
Déjà Dup restic
(anciennement duplicity)
Supporté Supporté Supporté Très simple : 2 gros boutons (sauvegarder, restaurer) et menu préférences. Restauration totale ou restauration partielle depuis une option (clic droit → retourner vers la version précédente) avec GNOME Fichiers.
Très puissant et performant : incrémentation, versioning, chiffrement, compression, déduplication.
Ne permet pas de limiter le débit de transfert. Ne fonctionne pas sans utilisateur connecté. Installé par défaut sur la variante standard d'Ubuntu (avec GNOME). Permet de sauvegarder ses données sur un support externe, ou distant : serveur SSH / SFTP / FTP / WebDAV, ou sur un service cloud.
Permet de chiffrer les fichiers sauvegardés, et de planifier des sauvegardes automatiques.
Pika2) borg Supporté Supporté Supporté Très simple et ultra performant : incrémentation, versioning, chiffrement, compression, déduplication. Requiert un dépôt borg. Interface graphique GNOME pour Borg backup.
Disponible en Flatpak sur Flathub.
Areca Backup N/A Supporté Possible après quelques réglages Supporté Versioning, incrémentation, compression. Multiplateforme. Pas de planificateur intégré. Sauvegardes sur un support externe ou distant (FTP, FTPS, SFTP). Non présent dans les dépôts, uniquement sur sourceforge, plateforme plus vraiment fiable.
bacula mysql Supporté Supporté Supporté Incrémentation, versioning. Peut sauvegarder/restaurer sur différentes plateformes (Windows / Linux). Fonctionne en réseau ou non. Planification intégrée. Envoi de mail de compte rendu. GUI pas forcement très intuitive Sauvegardes complètes, différentielles ou incrémentales. Périmètre de sauvegarde largement paramétrable.
BackInTime rsync
diff
meld
Supporté Supporté Supporté Versioning. Simple a prendre en main. Interface disponible en mode graphique et en mode texte. Ne contient pas d'écran de tâche en cours.
Seule la communication est chiffrée, pas le contenu de la sauvegarde.
Interface graphique de rsync (copie), diff et meld (outils de comparaison de fichiers). Inspiré de Time Machine. Pas de compression possible. Gère la sauvegarde par SSH.
GitHub
BackupPC rsync
SMB
tar
Supporté Supporté Supporté Multiplateforme (Linux ou Windows). GitHub
Bareos mysql Supporté Supporté Supporté Fork de bacula avec intégration des patchs proposés.

Ligne de commande

Nom Front-end existant Incrémental Planification Restauration incorporée Points forts Points faibles Remarques
Borg Backup Vorta
Pika Backup
BorgWeb
CyborgBackup
Borg Hive
Supporté Possible après quelques réglages Supporté Gère la déduplication.
Très simple à appréhender et à gérer.
Plusieurs choix de compression (LZ4, ZLIB, LZMA) avec plusieurs niveaux.
Sauvegardes distantes avec SSH et méthode de chiffrement AES 256-bit.
La restauration d'un fichiers ou d'une sauvegarde complète est simple mais retrouver un fichier avec un niveau de sauvegarde précis peut-être long. La déduplication est une méthode qui consiste à tronçonner les fichiers de sauvegardes en morceaux et d'une sauvegarde à l'autre seuls sont sauvegardés les morceaux non similaires, ce qui permet un gain de place conséquent.
Il est possible de monter une sauvegarde comme un systèmes de fichiers, ce qui permet une restauration d'un ou plusieurs fichiers et même d'un répertoire par simple copier/coller.
Restic voir interfaces graphiques oui oui oui Gère la déduplication, la compression et le chiffrement. Basé sur rclone fonctionne absolument partout, quel que soit le stockage distant et avec d'excellentes performances. Outil en ligne de commande. Les interfaces graphiques ne sont pas disponibles dans les dépôts officiels. Documentation en anglais, en dehors de notre wiki. Aussi performant que Borg Backup et bien plus versatile car ne nécessite aucun prérequis côté dépôt de sauvegarde.
Backup-Manager N/A Supporté Possible après quelques réglages Non supporté Utilisation de fichiers .tar, faciles à restaurer sans outil spécifique.
De très nombreuses options et possibilités de sauvegarde (voir la page du wiki pour plus d'infos).
Ayant de très nombreuses options de sauvegarde, la configuration fine prend du temps.
La restauration d'un ou plusieurs fichiers est simpliste (utilisation de tar) mais retrouver un fichier dans des sauvegardes différentielles peut être très chronophage.
Sauvegarde de fichier locaux sous forme d'archives pouvant être exportée sur un serveur (via FTP, SSH, RSYNC,…) ou gravée sur CD/DVD.
Planification/Restauration: cf. note ci-dessous.
Dar N/A Supporté Possible après quelques réglages Supporté Incrémentation, restauration rapide même un seul fichier au sein d'une grande sauvegarde, chiffrement fort, compression, découpage en tranche, pris en compte de tout type d'inode, des liens durs, des fichiers creux, des attributs étendus, robustesse du format contre les corruptions, compatible avec SSH, documentation fournie ligne de commande uniquement, beaucoup d'options, peut devenir complexe si on les utilise toutes, pas de planificateur intégré (utiliser crontab) sauvegardes sur support externe ou via SSH, plusieurs interfaces graphiques externes disponibles : gdar, kdar, etc.
rdiff-backup Gnome-EasyBackup Supporté Possible après quelques réglages Possible après quelques réglages Planification/Restauration: cf. note ci-dessous.
rsnapshot Webmin Supporté Possible après quelques réglages Possible après quelques réglages rsnapshot est basé sur rsync.
Pour la planification, voir le chapitre Automatisation.
rsync BackupPC
BackInTime
Grsync
Supporté Possible après quelques réglages Possible après quelques réglages rsync est un outil de synchronisation, pas de sauvegarde, mais il est le "moteur" de quelques solutions. Planification/Restauration: cf. note ci-dessous.
Il existe aussi un tutoriel.
duplicity Déjà Dup Supporté Possible après quelques réglages Possible après quelques réglages Compresse et chiffre les données avec GPG avant l'envoi. duplicity est un outil de synchronisation, pas de sauvegarde, mais il est le "moteur" de quelques solutions.
unison unison-gtk Non testé Non testé Non testé Unison est un outil de synchronisation, pas de sauvegarde, mais il est le "moteur" de quelques solutions.
  • Amanda et dirvish sont des outils d'administration système conçus pour effectuer les sauvegardes de multiples ordinateurs en réseau, dans une logique contrôleur principal / des machines secondaires administrées.
Si l'application ne gère pas la planification et/ou la restauration, on peut y remédier. C'est en particulier le cas pour des outils simples, dédiés à la copie ou la synchronisation plutôt qu'à la sauvegarde.
  • Planification : on peut utiliser cron ou un timer systemd.
  • Restauration : elle sera manuelle, en copiant les fichiers depuis la sauvegarde.

Copie de partitions

Ces outils permettent de créer des images des partitions du système.

Ces outils ne permettent pas de sauvegarder ses données de manière simple et efficace.
  • Il n'est pas possible de sauvegarder de manière incrémentale, chaque sauvegarde est extrêmement longue.
  • Il n'est pas possible de conserver de version antérieure d'un même fichier.
  • La restauration de données spécifiques est fastidieuse.
  • Il ne s'agit pas d'outil de sauvegarde, donc ils ne fournissent pas la plupart des fonctionnalités permettant de faciliter cette pratique, et ne permettent pas non plus d'automatisation.
Nom utilise (Back-end) Incrémental Planification Restauration incorporée Points forts Points faibles Remarques
CloneZilla N/A Non supporté Non supporté Supporté Très efficace, peut fonctionner indépendamment du système d'exploitation. Prend en charge tous les systèmes de fichiers (Linux, Windows et macOS). Chiffrement possible des images disques. Plusieurs modes d'utilisation : système installé ou système indépendant d'Ubuntu. Interface austère. C'est l'équivalent libre de Norton Ghost ou Acronis True Image. Permet de créer une image de sauvegarde d'un support ou d'une partition, puis de la restaurer. CloneZilla peut être utilisé en session live USB.
Partclone N/A Non supporté Non supporté Supporté Supporte de très nombreux systèmes de fichiers (Btrfs, ext4, XFS, NTFS, FAT32, HFS+, etc.). Rapide, fonctionnement similaire à partimage et utilisé par CloneZilla. Pas d'interface graphique (ligne de commande) Partclone peut être utilisé en session live USB pour sauvegarder votre système. Pour l'installer, il suffit d'installer le paquet partclone.
partimage N/A Non supporté Non supporté Supporté Simple et efficace pour ce qu'on attend de lui. Ne gère pas Btrfs. Gourmand en espace disque, restauration partielle délicate. Équivalent de Norton Ghost. Peu adapté pour des sauvegardes régulières.
fsarchiver N/A wiki:modeles:laptop_ok.png?nolink Non supporté Supporté Efficient. Inclus dans SystemRescue.

Services et serveurs cloud

Voir aussi et surtout les pages Cloud et Anonymat.
Nom Client pour Ubuntu Code source ouvertIncrémental Planification Restauration incorporée Points forts Points faibles Remarques
CrashPlan Supporté Non Supporté Supporté Supporté Supporté Installable sur serveur personnel Il n'est plus possible de prendre une offre personnelle, il n'existe qu'une offre "Business" depuis mi-2017 Différentes offres Free, Familiale, Pro Solution très performante et sûre
Dropbox Supporté Non supporté - - - - Non installable sur serveur personnel, sauvegarde des données à l'étranger -
OutBackup Supporté Non supporté - - - Sauvegarde différentielle sur des serveurs hébergés en France Serveur non installable sur ordinateur personnel, service commercial -
Mega Supporté Non supporté - - - Chiffrement des données de bout en bout - Gratuit jusqu'à 50 GB
Owncloud Supporté Supporté - - - Installable sur serveur personnel, maîtrise complète des données - Au fil du temps, l'entreprise qui gérè OwnCloud s'est éloignée de la communauté des développeurs, et à commencée à délaisser la version open source, ce qui à conduit à la création du fork Nexcloud
Nextcloud Supporté Supporté - - - Installable sur serveur personnel, maîtrise complète des données. Licence AGPLv3. Fonctions avancées de cloud (client de synchronisation multi-plateformes type dropbox, édition en ligne via LibreOffice online, système de tchat vidéos type skype, contacts et calendriers synchronisés, client mail…) - C'est un fork de owncloud, créé en 2016 par le co-fondateur et COO de ownCloud, et une grosse partie des développeurs, afin de mieux respecter l'esprit du libre. De nombreuses fonctions ont été ajoutées, y compris des options qui n'étaient disponibles que dans la version payante de owncloud
pCloud Supporté Supporté - Possible après quelques réglages - Société suisse. Synchronisation ou sauvegarde avec un outil standard. En option payante, un dossier avec cryptage à partir du poste utilisateur avant transfert, invulnérable. Tarifs à vie. - Monte au démarrage comme un disque externe ; bien intégré à Ubuntu. Possibilité se choisir entre les USA ou le Luxembourg pour le stockage des données.
Pydio Supporté Supporté - - - Installable sur serveur personnel - -
Seafile Supporté Supporté - - - Client pour Linux, Mac, Windows, Android et iPhone et serveur pour Linux et RaspberryPi - Semble prometteur
Sparkleshare Supporté Supporté - - - - - -
SpiderOak Supporté Client : Non libre Serveur : Non libre - - - Bien intégré à Ubuntu, client pour Windows, Mac, Android et iPhone. Support efficace et réactif
Chiffrement des données
Non installable sur serveur personnel, sauvegarde des données à l'étranger, service commercial -
Syncany Non supporté Supporté - - - Installable sur serveur personnel, maîtrise complète des données Pas encore de client pour Ubuntu -
Symform Supporté Beta Non supporté - - - Sauvegarde sur une multitude de serveurs (techno. P2P)
Sauvegarde chiffrée
Gratuit en échange d'espace disque
Aucun contrôle sur la dispersion des données
Quid de la pérennité de la formule ? Le service a fermé en juillet 2016
-

redondance RAID / Btrfs / ZFS

Attention, le RAID n'est PAS une sauvegarde, il ne permet pas de récupérer des données perdues !

Avoir une bonne sauvegarde consiste à avoir ses données en permanence sur au moins 2 supports fonctionnels en même temps, et idéalement sur 2 sites différents.
Ce n'est pas ce que propose le RAID, qui s'adresse plutôt aux administrateurs qui ne peuvent pas se permettre de perdre du temps lors de la panne et du changement d'un disque dur.

En effet, même si certaines configurations RAID, Btrfs ou ZFS peuvent survivre à la panne d'un disque en apportant de la redondance, elles ne constituent pas une solution de sauvegarde :

  • Si une surtension atteint la carte mère ou contrôleur, tous les supports peuvent être foudroyés en même temps (à ce sujet les alimentations électriques de bonne qualité sont censées être moins dangereuses que les alimentation sans marque généralement vendues dans les PC pré-assemblés.).
  • La redondance locale ne protège évidemment pas non plus d'une inondation, d'un incendie, d'un cambriolage, ou autre (voir Répète après moi : le RAID n’est pas de la sauvegarde !).
  • Lorsqu'on monte un RAID, on utilise très souvent plusieurs supports identiques fabriqués à la même période. Il ne faut alors surtout pas tarder à remplacer un disque si l'un d'eux vient de rendre l'âme car le ou les autres du même groupe peuvent suivre. Mais en plus lorsqu'on remplace ce disque, tous les autres sont particulièrement sollicités pour "reconstruire" le RAID. Les chances qu'un autre disque tombe en panne à ce moment fatidique sont alors très, très loin d'être négligeables.
  • Le dernier problème vient du fait qu'il faut connaître la procédure de remplacement et de restauration au moment problématique pour vous éviter une fausse manœuvre. Même s'il n'est pas toujours complexe, le procédé est très anxiogène si l'on tient aux données présentes sur les disques.

Il est donc plus probable qu'une redondance RAID vous apporte un faux sentiment de sécurité (sans doute construite par le marketing des vendeurs de NAS), alors que la réduction de votre espace de stockage est par contre bien réelle.

La redondance RAID permet juste de maintenir le système en fonctionnement en cas de défaillance de l'un des disques le temps de le remplacer. Et quand cela arrive, il est tout à fait possible et courant qu'un second disque ait une défaillance durant la reconstruction du RAID (même âge, même usage).

La redondance locale de l'information permet juste d'augmenter la tolérance aux pannes et de diminuer la probabilité de l'indisponibilité du système. Cette technique est donc intéressante pour les administrateurs systèmes qui gèrent des volumes de données importants sur des services qui ne peuvent pas se permettre de longues indisponibilités, mais très peu utile, voire contre-productive pour les utilisateurs ordinaires.

Voir aussi

Pages traitant de la sauvegarde


Contributeurs : jahwork, zHt, sylvainsjc, lucrash, krodelabestiole.

1)
sources sur le forum