Nouvelles

Démystifier le stockage objet

17 février 2017

 

 

 

 

 

 

 

 

Le monde numérique dans lequel nous évoluons aujourd’hui produit de nouvelles données sur une base constante. Pour pouvoir être utilisables dans le futur, ces données doivent pouvoir être enregistrées et conservées efficacement.

L’explosion des données

Dans un article, le magazine Forbes[1] a résumé 20 faits sur la création des données dans le monde d’aujourd’hui, ce que l’industrie appelle le « Big Data ». On y apprend plusieurs faits surprenants dont :

  • Il y a eu plus de données créées dans les deux dernières années que dans toute l’histoire de l’humanité auparavant ;
  • En 2020, 1,7 Mo de données s’ajoutera chaque seconde, pour chaque humain sur la planète ;
  • En 2020, le volume de données totales de l’humanité (étant aujourd’hui de 4,4 Zettaoctets) sera de 44 Zettaoctets ou 44 trillions de Go.

Ces données sont créées partout, en tout temps, sans que nous en soyons conscients :

  • Nos téléphones intelligents enregistrent les sons ambiants et nos déplacements.
  • Les cartes de fidélisation enregistrent nos habitudes de consommation.
  • Facebook, Google, Twitter et toutes les applications que nous utilisons quotidiennement brossent un portrait virtuel de nos vies et de notre personnalité.

Toutes ces données représentent une mine d’or pour les compagnies qui les possèdent, mais elles comportent aussi un problème ; pour les utiliser et en tirer des revenus, elles doivent être conservées à long terme et de manière sécurisée. La question qui se pose alors est : comment procède-t-on ?

Le stockage traditionnel

Depuis quelques années, les technologies de stockage se sont raffinées, nous utilisions des serveurs avec du stockage interne, distribué et mal utilisé. Autrefois, il y avait une sous-utilisation du stockage disponible, puisque celui-ci était distribué. Sont alors apparues les unités de stockage de type Bloc ou NAS, formant ce que nous appelions généralement un SAN (Storage Area Network) ou un réseau de stockage. Ce faisant, nous sommes devenus en mesure de partager les ressources et l’espace de stockage dynamiquement entre plusieurs serveurs. L’utilisation des ressources de stockage est donc devenue beaucoup plus efficiente et minimise les pertes d’espace.

Le stockage de type bloc

Le stockage de type bloc se caractérise par l’utilisation de blocs généralement de petites tailles, ne contenant aucune forme d’information autre que les données elles-mêmes qui, à plusieurs blocs, forment un fichier. Ce type d’unité de stockage intègre des fonctionnalités de protection contre les bris physiques, connus sous le terme RAID. Le stockage de type bloc est indépendant du système de fichier qui le référence. C’est l’élément de base de l’unité de stockage.

Les serveurs accédant à ces données sont responsables de maintenir l’organisation (structure) et les métadonnées (permissions, propriétaire, date de création, etc.) via leur système de fichier. Les protocoles blocs sont typiquement SCSI, FC et iSCSI.

Le stockage de type « file » ou fichier

Ces unités de stockage présentent les blocs assemblés comme des fichiers, directement accessibles aux utilisateurs, sans avoir besoin d’un serveur comme intermédiaire. L’unité de stockage possède typiquement un système d’exploitation propriétaire qui agit comme le ferait un serveur. Cette unité maintien la cohérence (structure) et les métadonnée ou attributs (permissions, propriétaire, dates, etc.) relatifs aux fichiers à même l’unité.

Chaque utilisateur ou application peut donc accéder directement aux fichiers via des protocoles comme CIFS ou NFS.

Pourquoi avons-nous besoin d’une nouvelle technologie ?

Les systèmes de stockage de type bloc ou fichier sont efficaces dans des environnements locaux aux périphériques standards, postes de travail, serveurs, etc. L’arrivée des périphériques mobiles, des travailleurs à distance et de la nécessité d’accéder aux données n’importe où et n’importe quand a provoqué le besoin d’une technologie plus adapté à notre mode de vie « instantané ».

En effet, les protocoles décrits précédemment s’adaptent mal au transport sur des réseaux publics et non sécurisés.

Qu’est-ce qu’un objet en termes de stockage ?

Un objet est un fichier auquel est accolé un ensemble de propriétés appelées métadonnées, récupérables à partir d’un jeton (ID). Ces métadonnées peuvent être diverses, par exemple :

  • Propriétaire
  • Permissions
  • Dates
  • Type de fichier
  • Niveau de confidentialité
  • Durée de vie
  • Protection contre la copie
  • Protection contre l’effacement
  • Protection contre la modification

Le stockage objet est une technologie qui traite des objets comme élément de base. Le protocole de base de ces technologies est fondé sur le protocole HTTP/HTTPS, typiquement utilisé pour interroger des pages Web, accessible facilement partout avec n’importe quel périphérique. Les pare-feu ne bloquent généralement pas ce type de trafic. En traitant des objets à travers ces protocoles, les commandes sont simples (Get, Put, Delete) et les mécanismes « Restful API[2] » permettent une cohabitation avec tous les types de périphériques.

Lorsqu’un fichier et ses métadonnées sont déposés dans ces unités de stockage non structurées, les données y sont placées pêle-mêle. C’est-à-dire que, contrairement aux technologies mentionnées précédemment, les fichiers ne sont pas stockés dans une hiérarchie de dossiers dans lequel l’humain peut logiquement se retrouver, un peu comme lorsqu’un enfant range ses blocs de construction de toutes les couleurs et de toutes les formes dans un bac.

Lors du dépôt (Put) de cet objet, un jeton (ID) qui identifie l’objet en question est remis au propriétaire en vue d’une récupération future. Un système qui s’apparente à celui d’un vestiaire public. C’est-à-dire que vous remettez votre manteau, vous obtenez un ticket qui vous sert à récupérer vos effets à la fin de la soirée. Pendant la soirée, votre manteau sera rangé pêle-mêle avec ceux des autres invités, il est fort probable qu’il pourra changer d’emplacement selon les besoins du fournisseur de service, mais avec votre ticket, il sera facilement repérable lors de votre départ (Get).

Le stockage objet est donc par définition : un service de stockage public, accessible par une multitude de périphériques, pour une multitude d’applications, peu importe l’endroit, avec un fort volume de données, une période de rétention plutôt longue et un accès peu fréquent.

Comment sont protégées mes données ?

Ces services de stockage sont implantés de façon à maximiser la rétention des données, tout en maximisant l’utilisation de l’espace. Les principes de RAID[3] sont absents de ce type d’installation. Le fournisseur précurseur de stockage objets Amazon, avec son offre S3 avait comme objectif d’utiliser du matériel de type commodité (des serveurs ou unités de stockage bas de gamme) et d’ajouter de façon logicielle « Erasure Coding[4] », une robustesse permettant de conserver l’accès aux données malgré la perte de composantes matérielles (disques, unités de stockage ou même un site complet), tout en minimisant les coûts.

Les infrastructures de stockage objet sont ainsi typiquement réparties sur plusieurs sites géographiquement éloignés, sur des dizaines, voire des centaines d’unités de stockage différentes. Chaque objet pouvant se retrouver dans chacun des sites à plusieurs reprises. Ainsi, advenant un bris physique, les données sont virtuellement disponibles pour l’utilisateur.

En utilisant une infrastructure de la sorte, les temps de rétention statistiques sont de l’ordre de plusieurs milliards d’années avant une perte de données, dépendamment de l’arrangement de la solution.

Les domaines d’applications facilement adaptables au stockage objet sont nombreux :

  • Systèmes de sauvegarde: la majorité des applications supportent maintenant le stockage objet de type S3 ou Swift nativement, permettant de conserver une copie des sauvegardes pour une longue période, sans devoir recourir à la mise en voute sur ruban magnétique.
  • Solutions d’archivage qui peuvent automatiquement déplacer des fichiers non utilisés dans une période de temps donné dans un service de stockage objet.
  • De la surveillance vidéo : beaucoup de données, peu de probabilité de devoir procéder à la relecture, mais elles doivent être conservées longtemps.
  • Des applications de votre fournisseur de câble comme Netflix, Dropbox, iTunes, « vidéo-sur-demande », etc.

Conclusion

Un des aspects que j’apprécie dans le monde des technologies est que nous en avons toujours plus à apprendre. En tentant de vous expliquer le stockage objet, j’ai touché à des concepts comme le RAID, Erasure Coding, des environnements distribués, du RESTful API. Des sujets tous passionnants à découvrir pour les gens qui, comme moi, sont avides de technologies.

Vos besoins concernant le stockage objet dépendent de l’importance de vos données. Par contre, il y a fort à parier que vous en utilisiez déjà. Je vous ai donné en exemple quelques services qui sont basés sur du stockage objet dans la vie de tous les jours. Dans le monde de l’entreprise, les besoins sont aussi nombreux. Il est important de faire appel à des gens ou des firmes qui comprennent et maîtrisent ces nouvelles technologies et qui ont la capacité de vous aider à analyser la pertinence de ces options.

Il est aussi possible de faire des économies substantielles en utilisant ces nouvelles technologies. Pensez aux frais reliés à la gestion des rubans magnétiques, la manutention pour la mise en voute, le transport, les délais de restauration, les taux d’échec lors de restauration, etc.

Chez Micro Logic, nous comprenons ces technologies et avons de bons partenariats avec des manufacturiers de premier plan qui possèdent ces technologies. Nous sommes donc en mesure de vous assister dans l’analyse et l’évaluation de vos besoins.

J’espère avoir pu vous éclairer un peu sur le sujet du stockage objet, qui est omniprésent dans nos vies.Si vous avez des commentaires ou des questions, n’hésitez pas à contacter l’équipe de Micro Logic.

 

_____________

Guy Gagnon, œuvre dans le domaine des technologies informatique en entreprise depuis près de 25 ans, il a développé une forte expertise technique à travers ses différents mandats au cours de sa carrière sur une variété de technologies et comprend bien les enjeux d’affaires. Il est responsable de l’offre globale de services pour Micro Logic et est constamment à l’affût des nouveautés. Vous pouvez le contacter par LinkedIn ou directement chez Micro Logic au 1 877 658-6624.

[1] http://www.forbes.com/sites/bernardmarr/2015/09/30/big-data-20-mind-boggling-facts-everyone-must-read/#71dc450e6c1d

[2] https://en.wikipedia.org/wiki/Representational_state_transfer

[3] http://www.pcworld.com/article/194360/raid-made-easy.html

[4] https://en.wikipedia.org/wiki/Erasure_code

Pour toute question technique, écrivez-nous à service@micrologic.ca