Cloud OVH (Open Stack): Problème de boot/modules virtio-scsi ??? Le sujet est résolu

Demande d'aide : c'est ici.
Répondre
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 4974
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

Salut,

Je viens de connaître une mauvaise expérience avec un sevreur OVH (Cloud Public sur Open Stack).
La machine tournait depuis un an sans aucun soucis. Subitement Dimanche soir dernier elle est tombée en rade.
Aucune mise à jour importante récente, pas de charge particulière au moment du crash.

Bref, plus moyen d'accéder à la machine.

Soit je tombe sur Grub Rescue (Via la console VNC) soit c'est le mode rescue de OVH (Un boot sur une Debian Jessie minimale)

J'ai fait deux choses:

1) Tenté de démarrer à partir de Grub Rescue accessible dans la console VNC.
j'ai testé tous mes noyaux): Rien à faire, à chaque fois arrêt en cours de chargement ou initramfs: Can't find /dev/sda1.

2) En mode rescue + chroot j'ai tenté de comprendre ce qui se passait:
- Logs: Rien depuis le crash, et rien de particulier. Tout semble s'être arrêté d'un coup sans message particuliers.
- Noyaux + Grub: Rien, tout semble OK.
- Update/upgrade = ok

Réponse du support d'OVH après investigation (il semblerait qu'ils aient vu une alerte au sujet d'un problème disque - Je n'ai pas bien compris ce passage, je n'ai pas eu plus de détails)
Nos administrateurs me confirment que l'UUID indiqué correspond bien à l'UUID de votre disque.

Il semble que les modules virtio-scsi ne sont plus correctement installés au niveau de votre kernel. Sans ces modules, votre système ne parvient pas à reconnaître le volume (disque) qui lui est associé, d'où l'erreur retrouvée dans les logs.

Nous n'avons malheureusement pas plus de détails sur la l'origine de cette erreur qui semble uniquement dépendant de votre système (nous n'avons pas d'autres clients ayant d'erreurs comme celle-ci sur votre hôte).

Dans le cas présent, je vous invite à effectuer une sauvegarde de vos données et à procéder à la réinstallation de votre système. Nous ne pourrons pas pousser le diagnostic kernel à un niveau supérieur.

Voici quelques essais de démarrage avec grub2 (Désolé pour les images, mais c'est le seul moyen d'accéder aux infos de boot).


Image

Image

Image

Image

Image

Image


J'ai bien entendu essayé de reinstaller Grub2 dans un chroot; régénérer les modules avec update-initramfs
Rien à faire, je n'arrive pas à réparer...
Bref, dans le c.. la balayette.

Avez-vous une idée pour me sortir de ce pétrin ?
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
--gilles--
Membre actif
Membre actif
Messages : 526
Inscription : 24 août 2016, 19:35
Localisation : Gnome 43 - debian 12
Status : Hors-ligne

Regarde les commandes encore disponibles avec help. ( Enter 'help' for a list of built-in commands )
Y-at-il fsck ?
Parler de liberté n'a de sens qu'à condition que ce soit la liberté de dire aux gens ce qu'ils n'ont pas envie d'entendre. Eric Blair, George Orwell
Avatar de l’utilisateur
Grhim
Membre très actif
Membre très actif
Messages : 1384
Inscription : 30 mai 2016, 01:00
Localisation : kekparr'par'là
Status : Hors-ligne

lol a écrit : Il semble que les modules virtio-scsi ne sont plus correctement installés au niveau de votre kernel. Sans ces modules, votre système ne parvient pas à reconnaître le volume (disque) qui lui est associé, d'où l'erreur retrouvée dans les logs.
apparemment virtio aurait a voir avec kvm , ne connaissant pas je suis tomber la dessus :

il y a des petites explication ici https://www.ovirt.org/develop/release-m ... rtio-scsi/ , https://wiki.debian.org/KVM, https://fedoraproject.org/wiki/Features/virtio-scsi , https://wiki.libvirt.org/page/Virtio
Debian Stable + Testing -.- Kali Exegol -.- Raspberry IPFire
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 4974
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

--gilles-- a écrit : 14 oct. 2017, 12:22Regarde les commandes encore disponibles avec help. ( Enter 'help' for a list of built-in commands )
Y-at-il fsck ?

J'ai fait un e2fsck en mode rescue sur /dev/sdb1 (En mode rescue mon disque principal change de nom).
Il y avait des erreurs qui ont été corrigées. Mon disque est propre maintenant.
Grhim a écrit :apparemment virtio aurait a voir avec kvm , ne connaissant pas je suis tomber la dessus :

Oui, c'est une VM. Comme je le disais c'est de l'OpenStack.
Je vais vérifier si les outils sont présents. Mais je ne m'explique pas qu'ils aient disparus...
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
Avatar de l’utilisateur
piratebab
Site Admin
Site Admin
Messages : 4960
Inscription : 24 avr. 2016, 18:41
Localisation : sud ouest
Status : En ligne

peut étre que tu as en module des choses qui devraient étre en dur dans le kernel ?
Par contre, pourquoi cela pose seulement problème maintenant ..
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 4974
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

Salut,
piratebab a écrit : 20 oct. 2017, 09:40peut étre que tu as en module des choses qui devraient étre en dur dans le kernel ?
Par contre, pourquoi cela pose seulement problème maintenant ..

Possible, mais il faudrait que je recompile. Je n'ai pas le temps, c'est une VM que je vais balancer dans une semaine.

C'est arrivé subitement un dimanche soir alors que je n'ai rien fait de particulier...
J'ai du prendre une autre machine pour restaurer le plus vite possible mes services (dont les mails de ma boite...). Après avoir perdu 24h à essayer de réparer!!! :021:

OVH n'a pas proposé de me rembourser le mois perdu (car bien sur c'est arrivé en début de mois.
Je vais ouvrir un ticket (le premier à été fermé d'office) pour me plaindre. Je suis furax contre OVH sur ce coup.

Je laisse définitivement tomber les VM, je suis dégoutté...
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
Avatar de l’utilisateur
piratebab
Site Admin
Site Admin
Messages : 4960
Inscription : 24 avr. 2016, 18:41
Localisation : sud ouest
Status : En ligne

passe aux containers!
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 4974
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

piratebab a écrit : 20 oct. 2017, 13:22passe aux containers!

Pas pour de la production. Oui pour du dev, mais après faut être sérieux...
Un bon vieux serveur dédié, y'a rien de tel!
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 4974
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

Je marque résolu:

Après avoir perdu du temps à essayer de réparer, j'ai tenté une réinstallation: Ça mouline, mouline, et ma machine n'est pas réinstallée...

La solution: Je vais résilier mes VM sur le Cloud Public d'OVH: Service non fiable/Support technique insuffisant et aucun geste commercial.

Avec des dédiés je sais que je suis seul face à mes problèmes, si ça casse (sauf problème hardware évidemment) c'est de ma faute: je sais à qui m'en prendre et comment réparer.
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 4974
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

Mise à jour,

Après des semaines et quatre tickets, je me suis fait rembourser la machine dédié pendant un mois.

Donc même si le support n'est pas réactif, on arrive à ses fins...
Faut pas lâcher!!!
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
Répondre