Stocker des données à grande échelle n’est pas comme enregistrer un fichier sur votre disque dur. Il nécessite un gestionnaire de logiciels pour garder une trace de tous les éléments qui composent les fichiers de votre entreprise. C’est là que les packages de gestion de stockage distribués tels que Ceph et Gluster entrent en place.
Ceph et Gluster sont tous deux des systèmes utilisés pour gérer le stockage distribué. Les deux sont considérés comme un stockage défini par logiciel, ce qui signifie qu’ils sont largement indépendants du matériel. Ils organisent les bits qui composent vos données à l’aide de leur propre infrastructure sous-jacente, ce qui définit ce choix : quel cadre sous-jacent souhaitez-vous pour prendre en charge vos données ?
C’est une décision que vous souhaitez prendre en fonction du type de données que vous stockez, de la manière dont ces données sont accessibles et de leur emplacement. Ceph et GlusterFS sont tous deux de bons choix, mais leurs applications idéales sont subtilement différentes.
Contenu
Stockage basé sur les objets pour les données non structurées : Ceph
Ceph est un système basé sur des objets, ce qui signifie qu’il gère les données stockées sous forme d’objets plutôt que sous forme de hiérarchie de fichiers, répartissant les données binaires dans le cluster. Des méthodes de stockage d’objets similaires sont utilisées par Facebook pour stocker des images et Dropbox pour stocker des fichiers clients. En général, le stockage objet prend en charge des données massives non structurées, il est donc parfait pour le stockage de données à grande échelle. Le système est maintenu par un réseau de démons sous la forme de moniteurs de cluster, de serveurs de métadonnées et de stockage journalisé. Ceux-ci se combinent pour rendre Ceph capable mais plus complexe que la concurrence.
Le stockage peu commun basé sur des objets et des blocs signifie que Ceph utilise ses propres outils pour gérer le stockage. Cela nécessite que les administrateurs système se familiarisent avec les outils de Ceph. Le véritable fonctionnement interne de Ceph peut être difficile à saisir à première vue. Fondamentalement, vous devez être prêt à apprendre comment cela fonctionne pour en tirer des avantages. Le système autogéré et auto-réparateur peut réduire les dépenses d’exploitation courantes au fil du temps, et Ceph peut fonctionner sur du matériel serveur standard.
Le système peut également créer un stockage de blocs, fournissant un accès aux images de périphériques de blocs qui peuvent être supprimées et répliquées dans le cluster. Les applications peuvent accéder à Ceph Object Storage via une interface RESTful qui prend en charge les API Amazon S3 et Openstack Swift. L’objectif est de hautes performances, un stockage massif et une compatibilité avec le code hérité.
Stockage de blocs dans des arborescences hiérarchiques : GlusterFS
GlusterFS, mieux connu sous le nom de Gluster, est un magasin de fichiers plus traditionnel. Il est facile à configurer et une version correctement compilée peut être utilisée sur n’importe quel système doté d’un dossier. La flexibilité et la facilité d’utilisation est un avantage majeur du système. Bien qu’il puisse évoluer vers d’énormes capacités, les performances ont tendance à se dégrader rapidement. Il convient mieux aux fichiers de grande taille moyenne (supérieurs à 4 Mo) et à l’accès séquentiel. Un cluster peut s’étendre sur des serveurs physiques, virtuels et cloud, permettant une virtualisation flexible du stockage.
Gluster utilise le stockage par blocs, ce qui signifie que des morceaux de données sont stockés dans un espace ouvert sur les périphériques de cluster connectés. Le stockage basé sur des fichiers et des blocs utilise un système de fichiers qui organise les fichiers en arborescences hiérarchiques. Il regroupe des serveurs géographiquement distincts sur Ethernet pour créer un système de fichiers réseau parallèle évolutif. Gluster est essentiellement une version en cluster de FUSE et NFS, offrant une architecture familière à la plupart des administrateurs système. Il est conçu pour être simple, maintenable et largement utilisable, mais n’a pas la vitesse d’accès que Ceph peut offrir dans les bonnes circonstances.
Conclusion
Ceph est le mieux adapté à l’accès rapide aux données non structurées, qui constituent la grande majorité des fichiers dans le monde. Gluster est préférable pour l’accès séquentiel aux données, comme le streaming vidéo, ou pour les applications où la vitesse n’est pas aussi importante, comme la sauvegarde.
Quel système de stockage de fichiers utilisez-vous ?
Cet article est-il utile ? Oui Non