Le contrôle de l’augmentation des données

Avez-vous déjà erré dans les fichiers sur l’un de vos NAS ou autre média de storage? Le NAS typique est un gâchis de fichiers en double, de quasi-doublons et d’anciennes données provenant d’employés disparus depuis longtemps. C’est la quintessence du problème de la rétention de données moderne. La quantité de données stockées continue d’augmenter à un rythme spectaculaire et les données de sauvegarde ne sont pas différentes. Heureusement, mettre en place une politique de rétention des données est une façon de réduire la taille des sauvegardes et d’automatiser le processus de rétention.

Généralement, un processus de nettoyage manuel n’est pas réaliste. Un grand nombre de fichiers inutiles sont très «loins des yeux, loins du cœur» et, franchement, aucun administrateur ne veut porter la responsabilité des suppressions. Le problème est amplifié avec les données de sauvegarde. Les logiciels de sauvegarde font un mélange de sauvegardes incrémentielles et de sauvegardes complètes du système. Ces deux formes de sauvegarde servent des objectifs différents. Les sauvegardes incrémentielles sont une sauvegarde rapide de toutes les données modifiées ou ajoutées, généralement sur une base quotidienne, et servent à protéger l’état le plus récent du système de données.

La reconstruction à partir de ces sauvegardes prend du temps et est un peu plus sujette aux erreurs que nous aimerions l’admettre. Ainsi, une fois par semaine, la sauvegarde complète entraîne la mise en place d’une copie complète et cohérente du système. La protection des données entre les sauvegardes est une préoccupation commune, les logiciels réduisent donc l’incrément entre les sauvegardes pour fournir une sauvegarde continue là où les fichiers modifiés sont mis en file d’attente ou se tournent vers des approches de réplication pour conserver plusieurs copies actives. L’industrie est aujourd’hui un éventail de ces approches, en particulier avec la sauvegarde et la reprise après sinistre sur le cloud en option.

En fait, un problème est qu’il est possible de sur-protéger les données en créant trop de copies alternatives, rendant la vérification de la récupération un défi. Dans toute cette complexité, la décision de savoir quand un fichier est supprimé de la sauvegarde est très compliquée. Il ne s’agit pas seulement de savoir quand lancer les sauvegardes incrémentielles les plus anciennes, ou créer une nouvelle base pour les instantanés ou les incréments continus. Sans parler du fait que dans des domaines tels que les soins de santé,les secteurs financiers ou du secteur militaire, il existe différentes obligations légales concernant le moment où les données doivent être envoyées et ce qui doit être conservé.

Mettre en place une politique de rétention des données

La politique est la voie à suivre La réponse à ce dilemme de stockage de données est l’élaboration d’une politique de rétention de données de sauvegarde, où le système de stockage de données peut protéger ou supprimer des données en fonction de règles prédéfinies. À l’aide de métadonnées étendues étiquetées à chaque objet de données, ces systèmes peuvent planifier la suppression et désigner où les données doivent être stockées et comment elles doivent être chiffrées.

La plupart des systèmes en question utilisent le stockage d’objets pour les données. Sur le plan architectural, les magasins d’objets gèrent les problèmes épineux de la protection des objets contre les pannes de disques en les répliquant sur un certain nombre de nœuds de stockage et de lecteurs, même dans le but d’éviter les catastrophes naturelles. Un bon système de sauvegarde basé sur le stockage d’objets supprimera les fichiers en double en créant un hachage unique et en le comparant à d’autres objets, en résolvant les questions de quelle copie est valide et si toutes les copies sont identiques. Le processus de déduplication peut réduire la taille des données sauvegardées et constitue un véritable gain de temps. Notez que ce type de déduplication n’est pas réalisable avec les packages de sauvegarde qui créent de très gros fichiers « image ». Le risque de doublons est très faible. Des alternatives telles que la compression peuvent réduire la taille, mais je recommande de ne pas compresser les fichiers extrêmement volumineux, car ils peuvent être lents pour accéder à un objet particulier et sont plus sujets aux erreurs de décompression.

Combien de temps gardez-vous vos données?

Outre les données soumises à des règles juridiques, la durée de conservation des données est une question ouverte. À un extrême, nous avons des données qui circulent à travers des capteurs, tels que des caméras dans les magasins de détail. Ceux-ci peuvent donner des indications utiles sur la façon de vendre un client particulier, mais ce type d’information est très éphémère, avec une durée de vie d’environ 30 minutes. À l’autre extrême, nous avons des conceptions d’ingénierie que les entreprises doivent conserver pendant 15 ans ou plus, jusqu’à ce que la dernière machine cesse d’avoir des obligations de service.

La meilleure approche consiste à utiliser un moteur de règles qui peut définir une stratégie de rétention des données de sauvegarde de différentes manières, par utilisateur, par service, par dossier, par type de fichier, par projet, etc. Où doivent aller les sauvegardes? Le mode de sauvegarde préféré d’aujourd’hui consiste à utiliser le stockage en nuage public. Cette solution est économique par rapport à la sauvegarde interne et offre l’avantage d’être réellement «hors ligne et hors site», ce qui est essentiel dans un monde où le piratage est le facteur de risque le plus important pour les données.

Évidemment, les données dans un nuage public doivent être cryptées, mais il est essentiel que les clés soient conservées par le propriétaire des données. Aujourd’hui, les nuages ​​ont des niveaux de stockage froids et froids. Une stratégie de rétention des données de sauvegarde permet de parcourir automatiquement les données de hiérarchisation entre les deux, ce qui permet d’économiser de l’argent.

Si vous désirez avoir des conseils pour établir une politique de rétention pour votre entreprise, faites appel à l’un de nos experts en nous contactant par courriel ou au 418-524-4911.