<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
  </head>
  <body>
    <p>Bonjour,<br>
    </p>
    <p>A noter qu'avec un backend Ceph, il se peut que l'algo attende
      qu'un OSD soit réellement HS (pas juste une (micro-)coupure) pour
      commencer à rebalancer les données sur les noeuds restant. Il se
      peut donc que ça soit la cause de ce délais, en particulier si
      vous avez beaucoup de contenu à rebalancer, avec des grosses VMs
      en terme de stockage.</p>
    <p>Rémy.<br>
    </p>
    <div class="moz-cite-prefix">Le 29/06/2020 à 03:44, Clément Gineste
      a écrit :<br>
    </div>
    <blockquote type="cite"
cite="mid:CAMmM+CmHA6QnEQO9BZ2yBnozFmo+8TMNrRKJ1BEFLEjw9-s_aw@mail.gmail.com">
      <meta http-equiv="content-type" content="text/html; charset=UTF-8">
      <div dir="ltr">Il me semble que Xen supporte depuis longtemp le
        live migration d'une VM avec sa mémoire</div>
      <br>
      <div class="gmail_quote">
        <div dir="ltr" class="gmail_attr">Le mer. 17 juin 2020 à 20:02,
          Benoit MOREAU via FRsAG <<a href="mailto:frsag@frsag.org"
            moz-do-not-send="true">frsag@frsag.org</a>> a écrit :<br>
        </div>
        <blockquote class="gmail_quote" style="margin:0px 0px 0px
          0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
          <div> Salut,<br>
            <br>
            Je ne comprends pas trop le problème. Normalement, au moment
            où tu isoles le nœud en débranchant ses rings, il faut
            compter environ 2 minutes avant que le cluster lance sa
            procédure de failover. <br>
            Le nœud isolé va stopper les VM pour éviter le
            "split-brain", et le reste du cluster va relancer les VM qui
            ont été configuré en HA sur les nœuds ayant été configuré
            pour recevoir les VM.<br>
            <br>
            A priori, le temps de bascule est hard-codé. Selon moi, ce
            temps est raisonnable, pour éviter de relancer inutilement
            les VM en cas de coupure réseau passagère.<br>
            <br>
            A noter que sans configuration manuelle, il faut que plus de
            50% des nœuds du cluster soit vivant pour que celui-ci lance
            la procédure de failover.<br>
            <br>
            Je ne sais pas si j'ai répondu a ta question, mais je reste
            disponible si tu as d'autres questions sur Proxmox.<br>
            <br>
            Cordialement,<br>
            Benoit MOREAU<br>
            <br>
            <div>On 16/06/2020 22:55, Racamier Stéphane wrote:<br>
            </div>
            <blockquote type="cite">
              <div dir="auto">Bonsoir le groupe,
                <div dir="auto"><br>
                </div>
                <div dir="auto">Je test actuellement un cluster Proxmox
                  6.4 avec un stockage hyper convergé ceph composé de
                  3x6 osd (HDD) avec deux carte gigabit en protocole
                  LACP actif, 1 carte sur le ring0 et 1 sur le ring1.</div>
                <div dir="auto"><br>
                </div>
                <div dir="auto">La plateforme de test utilisé des HP
                  proliant dl380 g7.</div>
                <div dir="auto"><br>
                </div>
                <div dir="auto">Ma préoccupation principale est de
                  réussir à migrer mes VMs sans interruption de service
                  si le nœuds qui exécute se voit brutalement stoppé.
                  Pour simuler cette panne je débranche l'interface
                  ring0 et 1.</div>
                <div dir="auto"><br>
                </div>
                <div dir="auto">Petit problème mes VMs se voient stoppé
                  brutalement au décompte du watchdog, l'interruption
                  est bien trop longue pour des services en production.</div>
                <div dir="auto"><br>
                </div>
                <div dir="auto">Existe il un moyen de palier ce problème
                  ?</div>
                <div dir="auto"><br>
                </div>
                <div dir="auto">Cdlt.</div>
              </div>
              <br>
              <fieldset></fieldset>
              <pre>_______________________________________________
Liste de diffusion du FRsAG
<a href="http://www.frsag.org/" target="_blank" moz-do-not-send="true">http://www.frsag.org/</a>
</pre>
            </blockquote>
            <br>
          </div>
          _______________________________________________<br>
          Liste de diffusion du FRsAG<br>
          <a href="http://www.frsag.org/" rel="noreferrer"
            target="_blank" moz-do-not-send="true">http://www.frsag.org/</a><br>
        </blockquote>
      </div>
      <br>
      <fieldset class="mimeAttachmentHeader"></fieldset>
      <pre class="moz-quote-pre" wrap="">_______________________________________________
Liste de diffusion du FRsAG
<a class="moz-txt-link-freetext" href="http://www.frsag.org/">http://www.frsag.org/</a>
</pre>
    </blockquote>
    <pre class="moz-signature" cols="72">-- 
Dernat Rémy
IT Infrastructure Engineer, CNRS
MBB Platform - ISEM Montpellier</pre>
  </body>
</html>