Aujourd’hui, les grandes entreprises et administrations publiques hésitent entre continuer à utiliser des logiciels propriétaires ou basculer vers les Logiciels Libres. Pourtant, la plupart des logiciels libres sont capables de bien traiter les données issues des logiciels propriétaire, et parfois avec une meilleur compatibilité.
C’est alors la barrière de la prise en main qui fait peur, et pourtant...
Les logiciels libres
L’aspect « Logiciel Libre » permet une évolution rapide et une plus grande participation des utilisateurs. Les aides et tutoriels foisonnent sur Internet ou sont directement inclus dans le logiciel lui-même.
Enfin, les concepteurs sont plus proches des utilisateurs, ce qui rend les logiciels libres plus agréable à utiliser et conviviaux.
Grâce à la disponibilité des logiciels libres, vous trouverez facilement des services de support techniques et la licence n’est plus un frein à l’utilisation de ces logiciels par votre personnel.
Notre support technique concerne essentiellement les logiciels libres, que ce soit sous forme de services ponctuels ou de tutoriels.
Une passionnante discussion sur la liste NANOG vient de porter
sur les « problèmes gris ». Qu'est-ce qu'un problème gris en matière
de réseaux informatiques ?
Les réseaux ne sont pas fiables, toute personne qui a déjà vu un
message « Connection time out » peut en
témoigner. De l'erreur de configuration chez un opérateur à
l'attaque d'une pelleteuse sur une
fibre, en passant par une bogue dans les
routeurs, les causes de panne
ne manquent pas. Ces pannes sont typiquement binaires : soit toutes
les communications passent, soit aucune ne passe. À défaut d'être
faciles à prévenir, ou même à réparer, ces pannes sont triviales à
détecter : la supervision couine et les
utilisateurs râlent. Mais il y a aussi des pannes « grises ». C'est
quand ça déconne mais pas de manière binaire : la grande majorité du
trafic passe (et on peut donc ne s'apercevoir de rien) mais le
problème gris frappe une petite minorité des
paquets, selon des critères qui ne sont pas
évidents à première vue. Par exemple, le réseau laisse passer tous
les paquets, sauf ceux qui ont telle combinaison d'options. Ou bien
il laisse passer 99,99 % des paquets mais jette les autres (en
dehors du cas de congestion, où il est normal
de jeter les paquets). Dans la discussion sur NANOG, un
ingénieur citait
un cas qu'il avait rencontré où une line card
défaillante jetait tous les paquets IPv6 où
le 65e bit de l'adresse de destination était à 1 (ce qui est
apparemment assez rare). Le terme a été utilisé dans d'autres
contextes que le réseau (par exemple cette
étude de Microsoft).
La discussion sur la liste NANOG avait été lancée dans le
contexte d'une étude de l'École polytechnique de Zurich, étude
qui commençait par un sondage auprès des opérateurs pour leur demander s'ils
géraient les problèmes gris et comment.
D'abord, une constatation peu originale mais qu'il est important
de rappeler. Même en dehors de la congestion,
aucun réseau ne transporte 100 % des paquets. Il y a toujours des
problèmes, les réseaux étant des objets physiques, soumis aux lois
de la physique et aux perturbations diverses (comme les
rayons cosmiques). Aucune machine n'est
idéale, l'électronique n'est pas virtuelle et est donc imparfaite,
la mémoire d'un routeur ne garde pas forcément intact ce qu'on lui a
confié. Et, non, FCS et ECC ne détectent
pas tous les problèmes. Comme le notait un observateur :
« De ma longue expérience, j'en ai tiré une analyse (très
pertinente) : en informatique il y a entre 1 % et 2 % de magie.
C'est faux, mais ça soulage parfois de se dire qu'on est peut être
la cible d'un sortilège vaudou ou sous la coupe d'une bonne fée. »
Si un opérateur prétendait sincèrement ne pas avoir de problèmes
gris, cela indiquerait une absence de recherche plutôt qu'une
absence de problème. Fermer les yeux permet de dormir mieux :-)
Les problèmes gris sont très difficiles à détecter. Supposons
que, comme tout bon ingénieur, vous avez un système de
supervision automatique qui fonctionne,
mettons, en envoyant des messages ICMP de type Echo
et en attendant une réponse. Si vous envoyez trois paquets par test,
et que le réseau jette 1 % des paquets (un chiffre très élevé) au
hasard, vous n'avez qu'une chance sur un demi-million de
détecter le problème. Bien sûr, on ne se contente pas de ce genre de
tests. On regarde par exemple les compteurs attachés aux interfaces
des routeurs et on regarde si
les compteurs d'erreur grimpent. Mais si c'est l'électronique des
routeurs qui est défaillante, les compteurs ne seront pas
fiables.
Les problèmes gris sont parfois déterministes (comme dans
l'exemple du bit 65 plus haut) mais pas toujours et, s'ils ne sont
pas reproductibles, le problème est encore pire. Même s'ils sont
déterministes, l'algorithme n'est pas forcément évident. Si les
paquets sont aiguillés à l'intérieur d'un équipement selon des
critères complexes, et qu'un seul des circuits est défaillant, vous
ne trouverez pas forcément tout de suite pourquoi, des fois, ça
passe et, des fois, ça ne passe pas.
Est-ce grave pour l'opérateur ? Dans la discussion sur NANOG, un
participant a dit franchement que
les problèmes gris étaient fréquents mais tellement difficiles à
traiter (par exemple parce qu'ils impliquent souvent de longues et
difficiles négociations avec les vendeurs de matériel) qu'il valait
mieux les ignorer, sauf si un client râlait. Mais, justement, le
client ne râle pas toujours si le problème est rare, et difficile à
pointer du doigt avec précision. Et puis les systèmes modernes
comportent tellement de couches superposées que le client a le plus
grand mal à trouver l'origine d'un problème. Ainsi, dans le cas d'un
problème spécifique à IPv6, comme celui cité
plus haut, le fait que le navigateur Web
typique se rabatte automatiquement et rapidement en
IPv4 n'aide pas au diagnostic (même si c'est
certainement mieux pour le bonheur de l'utilisateur).
Pour donner une idée de la subtilité des problèmes gris, un
participant à NANOG citait un cas
d'un commutateur qui perdait 0,00012 % des
paquets, un nombre difficile à repérer au milieu des erreurs de
mesure. Le problème avait été détecté lors du remplacement des
anciens tests (genre les trois messages ICMP cités plus haut) par
des tests plus violents.
Bref, quand vous (enfin, votre navigateur Web) avez récupéré cet
article, peut-être un problème gris a-t-il perturbé cette
récupération. Peut-être n'a-t-il même pas été détecté et le texte
que vous lisez n'est pas le bon…