Je profite de la question suivante pour ouvrir cette discussion au sujet de l’infra envisagée pour l’instance Panoramax d’OSM-FR…
Oui quand on parle de peta-octet on se fait vite peur, mais fût un temps où le tera-octet faisait peur
Alors combien ça coût un Po ?
Compter 15€/To avec des disques d’occasion pas trop petits (genre 14To).
Avec de la redondance (3+1), on tourne à 20k€/Po ce qui n’est pas rien mais pas délirant. Si on a un backup… on double bien sûr.
Bien sûr si on stocke 1 Po dans du cloud c’est une autre histoire et surtout ce sont des coûts récurrents, alors que là on parle d’investissement et il y a le plus souvent des coûts à l’accès.
Ici le seul coût récurrent sera ensuite la conso électrique et le remplacement de disques qui viendraient à lâcher (de moins en moins fréquent).
On n’a pas besoin non plus de tout ce stockage pour démarrer, on peut ajouter des disques au fur et à mesure des besoins. Les prix devraient en plus baisser et les capacités augmenter.
Projet d’infra
- une baie de stockage
- des disques
- un serveur pour accéder à tout ça, voire faire des calculs
Baie de stockage
Une baie de stockage, c’est un gros machin dans lequel on peut mettre plein de disques.
Il n’y a pas de CPU, par de réseau, ce n’est pas un serveur, ça se raccord à un serveur avec une carte en liaison SAS (l’évolution actuelle du bon vieux SCSI).
Des baies de ce type peuvent accueillir jusqu’à 90 disques 3.5".
Exemple:
Ici il y a 5 tiroirs de 12 disques en 3.5", soit 60 disques.
A cela s’ajoute 2 contrôleurs et 2 alims (tout est redondant et « hot-plug »).
Disques
J’ai une pile de disques de 3To inutilisés:
- avantage: ils sont gratuits
- inconvénients: la conso électrique monte vite si on veut un volume total important
En effet, un disque 3.5" consomme entre 6 et 8W quelle que soit sa capacité, donc un 3To va consommer environ 4 fois plus par To qu’un 12To.
Sur le long terme ça coûte… mais ça permet de démarrer sur le court terme puis de les remplacer. C’est ce que j’ai fait il y a 2 ans pour opendatArchives, ces 3To ont été remplacés par des 10To financés par une cagnotte en ligne.
Serveur
Associé à la baie et aux disques, un serveur pour gérer l’API géovisio/panoramax, c’est à dire la base de données et servir les images ainsi que faire des calculs comme le floutage.
Pour le floutage, ce serveur pourra être équipé de GPU dédiés à l’IA (cartes Tesla) ou de TPU si cela donne de bons résultats. Les TPU sont bien plus économiques et ne consomment presque rien comparé aux GPU.
Quelques SSD en plus pour servir de cache et améliorer l’accès aux données de la baies de stockage qui n’aura que des HDD.
Test d’une baie de stockage
La semaine prochaine je reçois ça :
C’est une baie comme celle décrite ci-dessus.
Je vais la tester avec ce que j’ai, c’est à dire des 2To, 3To, 4To, 6To, 10To et 14To en SAS ou SATA et de différentes marques/origines pour valider qu’on peut effectivement partir là dessus. Je vais la connecter à un serveur qui sera suffisant pour le test avec une carte qui permet de gérer jusqu’à 1024 disques (car ces baies peuvent se chaîner).