Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

umap: synchro / redondance / haute dispo #86

Open
5 of 6 tasks
cquest opened this issue Jan 5, 2019 · 6 comments
Open
5 of 6 tasks

umap: synchro / redondance / haute dispo #86

cquest opened this issue Jan 5, 2019 · 6 comments
Assignees

Comments

@cquest
Copy link
Contributor

cquest commented Jan 5, 2019

Evolution de l'issue et des tâches à effectuer:

  • migration d'osm144 en ZFS
  • réplication sur les 2 autres noeuds
  • supression du rsync d'osm144 vers osm159
  • activer snapshot/backups
  • suppression d'osm159
  • activation de la haute-dispo de proxmox pour osm144

______ Issue d'origine _______

uMap tourne actuellement sur la VM osm144 qui est sur le noeud osm26
Comme c'est un service jugé critique (impact pour l'exterieur si down) est synchronisé via rsync par un cron horaire sur osm159 pour avoir une copie fraiche des données et permettre de le relancer rapidement.

Ce rsync provoque des pic d'IO sur les disques /dev/sdd des deux noeuds (osm26 et osm28) qui durent pas loin de 30mn, soit 50% du temps d'après les graphes munin (j'ai coupé la synchro qui a bien confirmé ça).

J'ai déjà migré osm159 sur ZFS (1h20 pour le déplacement) et créé un réplique sur osm27.
La synchro de la réplique prend juste quelques secondes au lieu de 30mn et ne sature pas les I/O.

Je propose donc de basculer dans un proche avenir umap sur osm159.
Cela consiste à:

  • passer umap en read only sur osm144
  • faire un rsync osm144>osm159
  • changer la config des proxy nginx pour diriger le flux vers osm159
  • remettre osm159 en read/write.

On aura du coup :

  • une réplique (déjà existante) et à faible impact pour le reste des VM et de l'infra.
  • la possibilité de le mettre en haute dispo (HA) avec bascule automatique en cas de panne d'un noeud
@cquest
Copy link
Contributor Author

cquest commented Jun 23, 2020

J'ai profité de l'upgrade proxmox pour déplacer umap sur ZFS.
J'ai ajouté les réplications toutes les 5mn sur les deux autres noeuds du cluster.
Plus besoin de rsync et plus besoin d'osm159.
Il est maintenant possible d'activer la haute dispo (HA) au niveau de proxmox pour que si le noeud du cluster où tourne umap tombe, le CT d'umap soit automatiquement démarrer sur un autre noeud.
Je met à jour les cases à cocher sur l'issue initiale...

@cquest
Copy link
Contributor Author

cquest commented Jun 23, 2020

Haute-dispo activée et rsync comment en crontab sur osm159.

Le bénef est flagrant sur les I/O d'osm26... reste plus qu'à supprimer osm159.

Quid des backups d'osm144/umap ? C'est un bon candidat pour les snapshots et un backup distants.

@jocelynj
Copy link
Member

Je vote +1 pour mettre des backups via les snapshots automatiques de proxmox.

@cquest
Copy link
Contributor Author

cquest commented Jun 26, 2020

Hier, coupure hard d'osm26 sur lequel tourne umap/osm144... et la haute dispo a fait son job et relancé osm144 sur osm27 :)

Last step... activer snapshot/backup et supprimer osm159

@cquest
Copy link
Contributor Author

cquest commented Jun 29, 2020

RIP osm159

@jocelynj
Copy link
Member

@cquest : on peut fermer le ticket, non ?
Il me semble que la réplication de umap sur les autres hosts est maintenant activée.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

4 participants