Opslag van data is en blijft belangrijk. En net als iedere technologie is storage technologie zeer dynamisch. Gedreven door de enorme vraag naar meer, sneller en vooral goedkoper. Ook de kwaliteitscriteria zijn meegegroeid:data verlies mag gewoon niet meer. Cloud storage oplossingen zijn helaas nog altijd beveiligingstechnisch verre van ideaal. Ook is het vaak duister hoe en of beschikbaarheid van cloud storage oplossingen daadwerkelijk goed is geregeld. Leveranciers van cloud storage geven niet graag technische inhoudelijk inzicht, maar beloven wel bijna 100% beschikbaarheid.
Met de komst van open source cloud technologieën heeft HAST een nieuwe versnelling gekregen. HAST staat voor Highly Available Storage. Operating systemen bieden van oudsher de meest robuuste en transparante infrastructuurservices nodig voor opslag bedrijfskritische data. Echter met het goedkoper worden van opslag en de vraag naar “storage-as-a-service” met een beschikbaarheid van 100% zijn opslag oplossingen nog altijd het domein van een slechts paar grote leveranciers (EMC, NetAPP, IBM, HP). Logisch, want hoge beschikbaarheid voor opslag van kritische data is nog altijd een meest serieuze zakelijke toepassingen waar bedrijven geen risico willen lopen.
Met de komst van cloud technologieën winnen open (source) technologieën echter langzaam terrein op een van de laatste bolwerken waar open source nog te zelden werd gebruikt: Bedrijfskritische hoog beschikbare opslag oplossingen.
Een typische open source hoog beschikbare opslag oplossing is HAST voor FreeBDS. Dit opslag framework is ontwikkeld door Pawel Jakub Dawidek als een raamwerk dat transparante opslag van dezelfde gegevens toestaat over fysiek gescheiden machines die verbonden zijn door een TCP/IP-netwerk. HAST maakt het mogelijk om een opslagcluster met hoge beschikbaarheid te bouwen dat resistent is tegen falende hardware. Volledig transparant en te gebruiken met ieder filesysteem.
De belangrijkste eigenschappen van HAST voor FreeBSD zijn:
- Maakt data opslag robuust voor I/O-fouten op lokale harde schijven.
- Bestandssysteem agnostisch. Dit betekent dat HAST voor ieder filesysteem te gebruiken is. Denk aan ZFS, CFS, EXT, FFS indelingen.
- Efficiënte en snelle (her)synchronisatie. HAST implementeert verschillende replicatie mechanismes voor synchronisatie. Ook hier moet met verstand een goede keus worden gemaakt.
- HAST kan gebruikt worden in bestaande omgevingen om later aanvullende redundantie toe te voegen.
HAST inzetten vereist net als iedere IT technologie een duidelijk afleidbare business requirement. Deze zal vaak afgeleid zijn vanuit een 99,999…% eis. Vanuit architectuur is het noodzakelijk om niet alleen richting mee te geven, maar ook inhoudelijke kaders en inhoudelijke keuzes te maken waar nodig. Om dit te kunnen doen is dan wel gedegen inzicht in keuzes en consequenties van keuzes noodzakelijk. Het niet goed neerzetten van een hoog beschikbare storage oplossing kan leiden tot een split-brain situatie. Bij veel SAN oplossingen komt dit helaas nog altijd vaak voor. Dit is een gevaarlijke situatie omdat knooppunten in het storage netwerk dan niet meer in staat zijn om te bepalen wat de primaire bron van veranderingen is. Het herstellen van een split-brain situatie kost veel tijd en handmatig herstel werk.
Zelf een hoog beschikbare storage oplossing implementeren op basis van een open source technologie is relatief eenvoudig en levert een robuuste hoog beschikbare ‘cloud-storage-service’ binnen een bedrijf. Mits goed vanuit een beveiligingsarchitectuur opgezet zijn er geen beveiligingshoofdbrekens meer. Wel dienen risico’s van de totale oplossing vooraf op het juiste niveau binnen de organisatie te worden afgewogen. Maar feitelijk geldt dit voor iedere technologie voor bedrijfskritische toepassingen. Open source of niet. Het voordeel van open is dat meer flexibiliteit voor de keus van een beheerpartij mogelijk is. Op korte en lange termijn, zonder vervelende vendor lock-in.