Erasure Coding… on efface quoi au juste?
28 avril 2017Depuis l’arrivée de tous les concepts et solutions software-defined, une des facettes qui prend de plus en plus son envol dans le marché québécois est le stockage défini par logiciel. Tout le monde a entendu parler des Nutanix, vSAN, Simplivity (qui vient justement de se trouver une nouvelle maison dans le portfolio de HPE), Datacore et tous les autres moins connus. Les grands manufacturiers ont aussi tous leur version de système de stockage traditionnel en format appliance (maintenant sous forme logicielle seulement) qui a l’avantage d’être portable, d’être en mesure d’utiliser de la quincaillerie que l’on a déjà et même de se transporter facilement dans le Cloud!
Le monde du stockage change beaucoup, et de plus en plus. Les préceptes que nous tenons tous pour acquis, comme les solutions de stockage, doivent absolument combiner le logiciel (microcode et OS propriétaire) et le matériel (contrôleur de stockage, ASICs optimisés, baies de disques, etc.) d’un même manufacturier. Les façons dont nous nous prémunissons contre des défaillances (le RAID) tendent à changer elles aussi.
Prenons la technologie RAID par exemple : c’est un stratagème qui est en pratique depuis de très nombreuses années, et la très vaste majorité des serveurs ou des systèmes de stockage en production aujourd’hui utilisent un type ou un autre de RAID pour se protéger d’un disque défaillant. Cela dit, le concept d’Erasure Coding se fait une place et, de toute façon, avec la taille des disques rigides qui augmente sans cesse, le RAID sera probablement appelé à être remplacé dans plusieurs cas.
Erasure Coding fait en réalité allusion à la capacité qu’a un système de détecter et de perdre accès (ou survivre à l’effacement, la disparition ou autre, d’où le terme anglais erasure) à un ou à des multiples extents sur ses volumes physiques, sans interruption de service. Selon le niveau de protection requis et configuré (le nombre d’extents qu’on peut perdre sans interruption du système), l’environnement peut survivre sans panne à 1, 2, 3 extents non-disponibles ou plus. Le RAID-5, en comparaison, pourrait survivre à la perte d’un seul extent, le RAID-6 de deux, etc.
LES AVANTAGES
Plus résiliente, cette technologie permet, selon le niveau de redondance requis par le besoin d’affaires, un niveau important et grandissant de redondance qui diminue les interruptions de services associées aux pannes de stockage.
Moins de vulnérabilité pendant les rebuilds, parce qu’en cas de défaillance d’un volume physique (un disque rigide par exemple), le fait de reconstruire quelques extents versus de reconstruire un disque en entier est immensément plus rapide. Cela signifie qu’on est quelques minutes ou secondes à découvert, versus plusieurs heures avec un RAID traditionnel.
Plus de performance pendant les rebuilds. Ceux qui ont vécu l’expérience d’un système de stockage qui place une trop grande priorité (par erreur de configuration ou par design) sur un rebuildle savent. La raison de la performance est simple, les rebuilds sont très, très rapides, car, tel qu’expliqué ci-dessus, seuls quelques extents doivent être reconstruits et non pas un disque complet. La taille des disques n’a plus aucune importance, ce qui permet des choses que le RAID ne peut pas offrir.
Coûts de maintenance plus bas, puisque le besoin de maintenance est diminué par la résilience inhérente du mécanisme de protection. Cela retarde le remplacement urgent de disques et les interventions humaines à la suite d’une défaillance.
Cette technologie est utilisée dans certains cas par les grands manufacturiers pour les très grands environnements de stockage puisque, passé une certaine capacité, la prise de copie de sûreté traditionnelle comme nous la connaissons devient quasiment impossible. Des niveaux de résilience différents deviennent donc requis.
De plus en plus, on en voit l’intégration dans les systèmes hyperconvergés et les solutions de stockage définies par logiciel. La mise en application du Erasure Coding va devenir de plus en plus populaire pour toutes ces raisons, et il est temps de s’y intéresser!
– Par Nicolas Brodeur, Ambassadeur des solutions d’infrastructures et infonuagiques