Le monde de l' intelligence artificielle (IA) a connu une croissance exponentielle et a une soif insatiable de consommer des données. Des voitures autonomes aux chatbots qui imitent la conversation humaine, l’IA révolutionne les industries à un rythme effréné. La puissance de l’IA provient de sa base de données. L'accès aux données, la vitesse de leur traitement et les performances de stockage évolutives sont autant de facteurs essentiels qui déterminent l'efficacité d'un pipeline d'IA. C'est là que Qumulo s'est révélé être la meilleure solution de stockage de données au monde pour les charges de travail d'IA, en tant que solution de données de fichiers la plus performante et la plus rentable du secteur dans le cloud.
Pourquoi Qumulo est idéal pour les charges de travail d'IA basées sur des fichiers
Les applications d'IA, qu'il s'agisse de modèles d'apprentissage profond ou de réseaux de neurones, nécessitent un ensemble unique de caractéristiques de stockage, qui sont toutes satisfaites par Qumulo :
- Évolutivité: Les ensembles de données d'IA sont dynamiques. Ils augmentent avec le temps à mesure que davantage de données sont collectées et traitées. La capacité de Qumulo à évoluer avec des performances élevées et prévisibles garantit qu'à mesure que les charges de travail d'IA augmentent, Qumulo peut répondre à ses demandes à n'importe quelle échelle.
- Rentabilité: Financer des initiatives d’IA peut représenter un investissement important. Économiser sur les coûts de stockage sans compromettre les performances peut libérer des ressources pour d'autres domaines critiques, qu'il s'agisse de recherche, de développement ou de déploiements de production.
- Possibilité d'évoluer n'importe oùTM: Les propriétaires d'infrastructures et les data scientists bénéficient de la flexibilité de la formation dans un endroit, mais du déploiement dans un autre, avec une infrastructure hautement sécurisée. Le système de stockage défini par logiciel de Qumulo peut être déployé et exécuté n'importe où. Cela facilite la formation d'un modèle d'IA dans le centre de données principal, mais permet de le mettre en production n'importe où.
- Performance : Les modèles d'IA, en particulier ceux utilisés dans des scénarios tels que les véhicules autonomes ou les transactions financières, nécessitent un accès aux données en temps réel pour la formation préalable et post-modèle. La récupération de données à grande vitesse de Qumulo garantit la disponibilité des données au moment où c'est nécessaire.
Examinons la puce n°4 et soulignons l'importance d'une récupération transparente et ultra-rapide des données/métadonnées. Ceci est vital pour les applications d’IA qui nécessitent un stockage de fichiers évolutif – sur site ou dans le cloud.
En testant des charges de travail d'IA synthétiques, nous avons constaté que nous sommes effectivement la solution cloud basée sur des fichiers la plus rapide du marché pour l'IA, où les scientifiques des données peuvent utiliser Qumulo pour la collecte de données, la pré-formation, la formation en production et l'inférence continue, quelle que soit l'échelle. .
Continuer à lire.
Benchmark d’IA largement applicable
Pour mettre en perspective les capacités de performances de Qumulo, examinons le dernier résultat obtenu avec Qumulo fonctionnant dans le cloud sur l'infrastructure AWS. Nous avons utilisé SPECstorage pour caractériser les performances de l'IA sur Qumulo. Ce benchmark (bien nommé AI_Image) exploite la taille des fichiers et les modèles d'E/S qui exercent de manière synthétique et précise les charges de travail d'IA courantes :
- Basé sur Tensorflow les meilleures pratiques – le framework IA/ML le plus largement déployé au monde
- Tracé à partir de 3 modèles différents : Resnet, VGG (Visual Geometry Group) et SSD (Single shot detector)
- Utilisation d'ensembles de données open source de CityScape, ImageNet et COCO
En raison de l'omniprésence de Tensorflow dans l'espace de l'IA, le benchmark s'applique à un large éventail de charges de travail de modèles d'IA qui produisent des résultats d'IA pour :
- Classification d'images et détection d'objets
- Traitement du langage naturel (PNL)
- Reconnaissance vocale
- Systèmes de recommandation
- Modèles génératifs
- Santé et sciences de la vie
…et beaucoup plus
Description du benchmark et résultats obtenus
L'objectif du benchmark est de transmettre rapidement les données du stockage Qumulo à la couche application (à l'aide de GPU) exécutant les tâches d'IA. Le benchmark teste les performances de stockage et la latence à partir d'un ensemble réaliste de modèles d'E/S provenant d'un lot de clients. Les clients augmentent progressivement leur nombre de tâches d'IA jusqu'à atteindre l'objectif, qui dans le cas de ce test est un total de 480 tâches. Il y a quatre opérations principales dans le benchmark, avec 4 sous-charges de travail simultanées indépendantes :
- AI_SF – Lectures de petits fichiers image
- AI_TF – Écrit des fichiers plus volumineux (idéalement plus de 100 Mo de fichiers)
- AI_TR – Lit dans de grands TFRecords
- AI_CP – Effectue des points de contrôle occasionnels
Résultats
La figure 1 ci-dessous affiche les résultats suivants :
- L'axe X montre le nombre de tâches exécutant le benchmark IA au fil du temps
- L'axe Y montre la latence globale pendant toute la durée du test
- La latence montre les performances de stockage de manière rapide et prévisible à mesure que le nombre de tâches d'IA augmente !
Fig. 1
** Comparaison basée sur les systèmes les plus performants dans les cloud publics publiée sur www.spec.org en octobre 2023. SPEC® et le nom de référence SPECgeneric® sont des marques déposées de Standard Performance Evaluation Corporation. Pour plus d'informations sur SPECstorage2020, voir https://www.spec.org/storage2020/.
Applicabilité sur site
Bien que les tests de référence SPECstorage aient utilisé un environnement basé sur le cloud, ces résultats peuvent être facilement extrapolés pour estimer les résultats en utilisant un matériel sur site similaire. Lorsque Qumulo publie ce benchmark sur le site Web de SPEC (ETA décembre/2023), les détails et le coût de l'environnement peuvent être trouvés, en notant les types d'instances EC2 (nombre de cœurs, mémoire disponible, etc.) utilisés et la bande passante disponible dans le réseau. environnement. En attendant, nous incluons les détails supplémentaires en annexe de ce blog pour les lecteurs curieux.
Scientifiques des données et ingénieurs des données, voici. Essayez-le vous-même !
Dans le monde en évolution rapide de l’IA, disposer d’une solution de stockage robuste, rapide et évolutive n’est pas un luxe mais une nécessité. Qumulo, avec ses performances et sa rentabilité de pointe, se distingue comme la solution de fichiers cloud de référence pour les charges de travail d'IA. Le benchmark souligne non seulement les prouesses de Qumulo, mais consolide également sa position de solution de stockage la plus rapide et la plus largement applicable pour l'IA.
See résultats complets publié sur Spec.org
Appendice
Performance
Temps de réponse global = 1.22 ms
|
Informations sur le produit et les tests
Qumulo – Référence du cloud public | |
---|---|
Testé par | Qumulo, Inc. |
Matériel disponible | Novembre 2023 |
Logiciel disponible | Novembre 2023 |
Date du test | Novembre 2023 |
Numéro de licence | 6738 |
Emplacements des titulaires de licence | Seattle, WA USA |
Qumulo est une solution de stockage de fichiers cloud hybride qui offre une évolutivité de plus d'exaoctets dans un seul espace de noms, des fonctionnalités identiques que ce soit sur site ou dans le cloud, et une prise en charge multiprotocole complète, garantissant flexibilité et compatibilité entre diverses applications. En s'intégrant de manière transparente à l'infrastructure de cloud public, Qumulo offre un stockage de données non structurées à n'importe quelle échelle, avec une visibilité en temps réel sur les performances de stockage et l'utilisation des données.
Le système de fichiers cloud natif de Qumulo permet aux organisations de migrer en toute transparence des applications et des charges de travail basées sur des fichiers vers l'environnement de cloud public. Avec Qumulo, les entreprises peuvent gérer efficacement des exaoctets de données, que ce soit sur site ou dans le cloud. Les résultats suivants démontrent clairement que le système de fichiers Qumulo excelle dans l'offre de performances exceptionnelles lorsqu'il est déployé sur AWS.
Solution en cours de test Nomenclature
Point n | Qté | Type | Vendeur | Nom du modèle | Description |
---|---|---|---|---|---|
1 | 16 | Instances AWS EC2 | AWS | c5n.18xlarge | Nœuds Qumulo – Instances Amazon c5n EC2 (les instances c5n.18xlarge ont 72 vCPU, 192 Go de mémoire, une mise en réseau de 100 Gbit/s) |
2 | 16 | Instances AWS EC2 | AWS | c5n.18xlarge | Clients Ubuntu – Cluster Qumulo – Instances Amazon c5n EC2 (les instances c5n.18xlarge ont 72 vCPU, 192 Go de mémoire, réseau 100 Gbit/s) |
Schémas de configuration
Qumulo dans AWS
Logiciel composant
Point n | Composant | Type | Nom et version | Description |
---|---|---|---|---|
1 | Qumulo Core | Système de fichiers | 6.2.2 | Le système de fichiers natif cloud de Qumulo permet aux organisations de déplacer sans effort des applications et des charges de travail basées sur des fichiers vers le cloud public. |
2 | Ubuntu | Système d'exploitation | 22.04 | Le système d'exploitation Ubuntu est déployé sur les seize nœuds de calcul c5n.18xlarge. Ils sont utilisés comme clients exécutant les benchmarks SPEC Storage 2020. |
Configuration et réglage du matériel – Physique
Nom du composant | ||
---|---|---|
Le nom du paramètre | Propositions | Description |
SR-IOV | Activé | Active la technologie de virtualisation du processeur |
Vitesse du port | 100 GbE | Chaque nœud dispose d'une connectivité 100 GbE |
Notes de configuration et de réglage du matériel
Aucune
Configuration et réglage du logiciel – Virtuel
Networking | ||
---|---|---|
Le nom du paramètre | Propositions | Description |
Cadres Jumbo | 9001 | Permet des trames jumbo Ethernet jusqu'à 9001 XNUMX octets |
Paramètres de montage NFS des clients Ubuntu | ||
Le nom du paramètre | Propositions | Description |
Vers | 3 | Utiliser NFSv3 |
nconnecter | 16 | Augmentez le nombre de connexions client NFS jusqu'à 16 |
tcp | Protocole de transport réseau TCP pour communiquer avec le cluster Qumulo | |
local_lock | tous | Le client suppose que les verrous flock et POSIX sont locaux |
Paramètre de volume EBS | ||
Le nom du paramètre | Propositions | Description |
IOPS | 16000 | IOPS maximales pour le volume EBS |
Cadence de production | 1000 | Débit maximum pour le volume EBS |
Notes de configuration et de réglage du logiciel
Aucune
Remarques sur les SLA de service
AWS déploie des efforts commercialement raisonnables pour rendre les produits et services inclus disponibles chacun avec un pourcentage de disponibilité mensuel d'au moins 99.99 %, dans chaque cas pendant tout cycle de facturation mensuel. Le pourcentage de disponibilité mensuel est calculé en soustrayant de 100 % le pourcentage de minutes au cours du mois au cours duquel l'un des produits et services inclus, le cas échéant, était dans l'état « Région indisponible ».
Stockage et systèmes de fichiers
Point n | Description | Protection des données | Stockage stable | Qté |
---|---|---|---|---|
1 | Volume de stockage Elastic Block, capacité de 1 To gp3. Chaque nœud Qumulo dispose de 6 volumes EBS. | Protection de 2 disques ou 1 nœud avec codage d'effacement | AWSEBS | 96 |
Nombre de systèmes de fichiers | 1 |
---|---|
Capacité totale | 78.54 TB |
Type de système de fichiers | Qumulo |
Notes de création du système de fichiers
Le système de fichiers Qumulo Core est déployé sur AWS via un modèle de formation cloud ou Terraform. L'AMI Qumulo Core est déployée et le système de fichiers est configuré dans le cadre du processus automatisé de formation de cloud ou via Terraform. Aucune étape supplémentaire de création de système de fichiers n'est requise.
Notes sur le stockage et le système de fichiers
Aucune
Configuration du transport – Virtuel
Point n | Type de transport | Nombre de ports utilisés | Remarques |
---|---|---|---|
1 | Carte réseau virtuelle Ethernet 100 Gbit/s | 16 | Utilisé par les machines clientes |
2 | Carte réseau virtuelle Ethernet 100 Gbit/s | 16 | Utilisé par Qumulo Core pour les communications inter-nœuds ainsi que pour les communications avec tous les clients. |
Remarques sur la configuration des transports
Aucune
Commutateurs – virtuels
Point n | Changer de nom | Type de commutateur | Nombre total de ports | Nombre de ports utilisés | Remarques |
---|---|---|---|---|---|
1 | AWS | Ethernet 100 Gbit/s avec mise en réseau améliorée | 16 | 16 | Utilisé par les machines clientes |
2 | AWS | Ethernet 100 Gbit/s avec mise en réseau améliorée | 16 | 16 | Utilisé par les nœuds Qumulo Core |
Éléments de traitement – virtuels
Point n | Qté | Type | Lieu | Description | Fonction de traitement |
---|---|---|---|---|---|
1 | 1152 | Processeur virtuel | c5n.18xlarge Noyau Qumulo | Processeurs Intel Xeon Platinum 3.5 GHz | Qumulo Core, communication réseau, fonctions de stockage |
2 | 1152 | Processeur virtuel | c5n.18xlarge Noyau Qumulo | Processeurs Intel Xeon Platinum 3.5 GHz | Spécifications des processeurs de référence du client de stockage |
Notes sur les éléments de traitement
Aucune
Mémoire – Virtuelle
Description | Taille en Gio | Nombre d'instances | Non volatile | Gio totaux |
---|---|---|---|---|
Mémoire d'instance AWS EC2 c5n.18xlarge | 192 | 16 | V | 3072 |
Mémoire d'instance AWS EC2 c5n.18xlarge | 192 | 16 | V | 3072 |
Gibioctets de mémoire totale totale | 6144 |
Notes de mémoire
Aucune
Stockage stable
Qumulo Core utilise des appareils Elastic Block Storage (EBS) ; qui offrent un stockage stable.
Notes de configuration de la solution en cours de test
La solution testée était un cluster distribué standard construit à l'aide de Qumulo Core. Les clusters Qumulo Core peuvent gérer des E/S de fichiers de grande et petite taille ainsi que des applications gourmandes en métadonnées. Aucun réglage spécialisé n’est requis pour les charges de travail différentes ou à usage mixte.