Greboca  

April  -  Parcoursup : un enfer pavé de bonnes intentions - Judicaël Courant

 -  3 août - 


Judicaël Courant

Titre : Parcoursup : un enfer pavé de bonnes intentions ?
Intervenant : Judicaël Courant
Lieu : Rencontres mondiales du logiciel libre 2018 - Strasbourg
Date : juillet 2018
Durée : 1 h 11 min
Visualiser la vidéo
Licence de la transcription : Verbatim
Illustration : copie d'écran de la vidéo
NB : transcription réalisée par nos soins.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas forcément celles de l'April.

Description

L'affectation des bacheliers dans l'enseignement supérieur en France était régi jusqu'en 2017 par un système appelé APB. Le gouvernement a choisi de remplacer celui-ci dès 2018 par un nouveau système, appelé Parcoursup.
Déléguer à une machine l'affectation des bacheliers dans le supérieur pose un certain nombre de questions :

  • Quelles règles souhaite-t-on pour l'accès au supérieur ?
  • Quels sont alors les objectifs assignés à la machine ?
  • Quel algorithme permet de les atteindre ?
  • Comment permettre à tous les citoyens de vérifier une exécution de l'algorithme ?

On verra rapidement quels faux et vrais problèmes posait APB et pose Parcoursup. J'expliquerai comment fonctionne l'algorithme qui les sous-tend (algorithme de Gale-Shapley) et j'expliquerai ce qu'il serait possible de faire pour améliorer Parcoursup.

Transcription

Bonjour. Tout le monde m’entend bien ? Impeccable. Je vais vous parler de Parcoursup. Qui je suis, d’abord, en quelques mots : je m’appelle Judicaël Courant ; j’ai une double formation mathématique et informatique ; je suis ancien maître de conférence en informatique et aujourd’hui j’enseigne en classe préparatoire.
Il est bien évident que ce que je vais vous présenter n’est pas le reflet d’une position officielle du ministère de l’Enseignement supérieur et de la Recherche, ni du ministère de l’Éducation nationale ; c’est ma vision des choses en tant que citoyen et en tant que citoyen qui a été confronté de près à Parcoursup et puis à ce qui s’appelait APB avant, Admission Post-Bac.

En quelques lignes, en quelques mots, qu’est-ce que c’est, à quoi ça fait référence Parcoursup ? Ça fait référence à un contexte qui est celui de l’affectation des élèves qui viennent d’avoir leur bac, les nouveaux bacheliers, dans l’enseignement supérieur et à la façon dont ça se fait en France.
Comment ça se fait en France ? Ça se fait via une procédure qui est centralisée, puisque tous les vœux des étudiants sont regroupés en un endroit, enfin des étudiants, des bacheliers qui ne sont pas encore étudiants ; c’est une procédure qui est automatisée : on exprime ses vœux par le Web et, dans cette procédure, les candidats, donc qui en général émettent leurs vœux avant leur bac, donc ce sont les futurs bacheliers, ils émettent leurs vœux, ils disent où ils veulent aller. Et puis les différentes formations sur lesquelles ils postulent, université, classe prépa, etc. classent les candidatures à partir de différents critères.

Il y a eu, vous l’avez sans doute noté dans l’actualité, il y a eu un gros changement entre 2017 et 2018. En 2017 il y avait un système qui s’appelait Admission Post-Bac, en abrégé APB, qui a été énormément décrié parce qu’il y avait un certain nombre d’étudiants qui n’avaient pas eu d’affectation, parce qu’il y avait des étudiants qui étaient affectés par tirage au sort – donc il y a un certain nombre de gens qui trouvaient que c’était une procédure un peu bizarre. Et puis, un autre point qui est petit peu plus technique, dont je parlerai par la suite, qui est une notion de bonus pour les premiers vœux. Les candidats qui demandaient une formation et pour lesquels c’était leur premier vœu étaient favorisés par rapport à ceux qui avaient mis cette formation-là en deuxième vœu mais qui n’avaient pas été pris sur leur premier vœu.

La ministre de l’Enseignement supérieur et de la Recherche, en juillet 2017 je crois, a décidé qui c’était fini Admission Post-Bac et qu’on remplaçait ça par un tout nouveau logiciel qui s’appelait Parcoursup. Si on regarde ce qu’il y a dans Parcoursup, il y a quelques bonnes intentions qui sont affichées : une intention c’est d’avoir plus de transparence, et puis il y a un critère qui est « on va essayer de favoriser les élèves qui sont boursiers en les remontant un petit peu dans les classements ».

Tout à l’heure Étienne Gonnu parlait des valeurs de la République française, enfin des valeurs des droits de l’homme ; dans la République française il y a liberté, égalité fraternité ; là on voudrait faire remonter un petit peu la valeur de fraternité, la mettre en avant. On verra qu’il faut peut-être se poser la question de liberté, égalité avant. Une des raisons qui me fait réagir sur Parcoursup, c’est que pour moi si fraternité c’est en troisième dans la devise de la France ce n’est pas parce que c’est le moins important, c’est parce que liberté et égalité sont des conditions nécessaires pour avoir la fraternité. Et on verra que Parcoursup, là-dessus, il y a des choses à redire.

Je n’ai pas précisé, n’hésitez pas à me poser des questions s’il y a des choses qui ne sont pas claires. On verra, j’espère que j’aurai assez de temps pour présenter tout ce que je veux présenter, mais s’il y a des choses qui ne sont pas claires, vraiment n’hésitez pas.

Une autre chose qui a fait beaucoup de bruit dans cette réforme Parcoursup, c’est la notion de sélection. Cette sélection elle existe. Pour moi c’est la conséquence d’une différence entre l’offre de formation et la demande de formation. À partir du moment où vous avez plus de bacheliers qui veulent faire des études supérieures que de places dans les études supérieures, il y aura nécessairement une sélection. On peut évidemment souhaiter que les choses évoluent, que le nombre de places augmente. Après, il y a des limites à ça : même s’il y a autant de places de formation au total que de bacheliers au total, tous les bacheliers ne peuvent pas aller faire, par exemple, leurs études à la Sorbonne. Donc il y aura de toutes façons une sélection.
Pour moi cette sélection, quelque part elle va rester nécessaire ; je ne vois pas comment elle ne va pas se produire. Et en plus, je trouve que c’est assez ridicule de dire qu’elle n’existait pas ou qu’elle n’existe toujours pas parce que, pour moi, elle existe déjà depuis 30 ans ; elle n'est juste pas assumée et donc ce que je préférerais c’est qu’on l’assume et qu’on se pose la question des critères sur lesquels on fait la sélection. Et les critères peuvent être divers et variés.
Le critère ça peut être premiers arrivés, premiers servis. Dans les années 80, quand vous aviez le bac et que vous vouliez une formation qui était assez demandée, il fallait courir aussitôt à l’université pour vous inscrire. Et si le secrétariat n’était pas ouvert, vous campiez devant le secrétariat en attendant l’ouverture. C’était le marronnier des journalistes tous les ans fin juin-début juillet, les files d’attente pour l’inscription devant, notamment, les filières STAPS [Sciences et techniques des activités physiques et sportives].
Après il y a d’autres critères qui existent : par l’argent. Ça c’est le cas des formations privées ; si elles ont trop de monde c’est simple, il suffit d’augmenter les frais d’inscription.
Autre critère qui a été utilisé c’est le hasard, j’en ai déjà parlé, le tirage au sort.
On peut imaginer qu’on trie aussi sur critères sociaux, ça se fait en partie dans Parcoursup ;
et puis on peut imaginer qu’on le fait aussi au « mérite » c’est-à-dire en fonction des notes ; ça ce sont des choses qui se font notamment pour les classes prépa ; j’ai mis « mérite » entre guillemets parce qu’on peut discuter de savoir si le fait d’avoir de très bonnes notes résulte uniquement d’un mérite du bachelier ou du fait qu’il est dans une catégorie socioprofessionnelle qui est plutôt favorisée.

Pour moi l’objectif, enfin les objectifs en fait de cet exposé, c’est qu’on puisse essayer ensemble de comprendre comment on peut faire cette sélection d’une façon qui soit raisonnable et comment se situent APB et Parcoursup. Est-ce que c’est raisonnable par rapport aux moyens dont on disposerait de faire une telle sélection ?
Et puis une fois qu’on a décidé un petit peu comment ça devrait être fait, est-ce qu’on peut faire confiance à un système informatisé qui fait ça ? Et à quelles conditions on peut faire confiance ?
Et essentiellement, j’espère qu’à la fin de cet exposé vous serez d’accord avec moi pour dire qu’on pourrait faire nettement mieux que Parcoursup et que ce n’est pas compliqué, finalement, de faire nettement mieux que Parcoursup.

Évidemment, il y a un truc qui est tout à fait évident, il y a un côté écran de fumée derrière la transformation d’APB en Parcoursup, c’est-à-dire qu’on dit : « Ah c’est la faute de l’informatique s’il y a des milliers d’étudiants qui n’ont pas eu de place dans le supérieur ». S’il n’y a pas assez de places dans le supérieur ce n’est pas la faute à l’informatique ! Vous pouvez avoir l’algorithme que vous voulez : quand il n’y a que deux places, s’il y a trois candidats, eh bien il y en aura un qui restera sur le côté ! D'accord ? Donc aucun algorithme ne peut résoudre le problème du manque de places dans l’enseignement supérieur. Après ça peut être un choix de dire « on veut plus de places » ou « on ne veut pas plus de places pour telle ou telle raison », mais il faut être clairs là-dessus.

On va commencer par un petit retour en arrière. Je vous propose qu’on revienne en 1985. Si on revient au milieu des années 80, on va faire cette petite expérience de pensée, vous pouviez vous inscrire dans plusieurs formations, il n’y avait pas de problème, il n’y avait pas de procédure informatisée et même pas de procédure centralisée. Comment ça se passait ? Essentiellement vous alliez à l’université sur place et après vous échangiez des courriers papier ou des coups de fil avec votre université. Vous alliez vous inscrire, on vous disait : « Désolé il n’y a plus de place, on vous met sur liste d’attente » et puis peut-être qu’une semaine après, deux semaines après, un mois après, vous receviez un courrier vous disant : « Ah, finalement on a une place, est-ce que ça vous intéresse ? » Alors là vous envoyiez, vous, une lettre pour dire « oui ça m’intéresse » et vous envoyiez une autre lettre à une autre université où vous étiez pris en disant « finalement je ne viendrai pas parce que j’ai eu autre chose ailleurs ».

Comment ça se passait ? On va prendre en exemple, on va faire une simulation. Pour simplifier les choses, on va prendre sept bacheliers ; je ne voulais pas les appeler A, B, C, D, E, F, G donc je les ai appelés Anaïs, Brice, Coline, David, Enola, Florent et Géraldine, et puis on imagine qu’ils veulent aller sur deux formations que j’ai appelées F1 et F2 et chaque formation a trois places. Donc si vous comptez bien, deux fois trois places ça fait six places, il y aura de toutes façons quelqu’un qui n’aura pas de place. Évidemment chaque candidat a ses propres préférences sur les formations et chaque formation a ses propres préférences sur les candidats, avec des critères qui peuvent être n’importe lesquels parmi ceux que j’ai cités avant.

On peut faire un tableau avec les différents candidats. Je vais supposer par exemple qu’Anaïs préfère aller d’abord dans la formation F2 puis s’il elle n’a pas F2 elle aimerait bien aller en F1. On fait ce tableau-là, je ne vais pas vous le lire en entier.
Et puis, de l’autre côté, les universités, elles, elles font un tableau de classement. Donc l’université F1, la formation F1 décide de classer Anaïs en premier, Brice en deuxième, Coline en troisième, David en quatrième, Florent en cinquième, Enola en sixième et Géraldine en septième. Alors que F2 décide de mettre David d’abord, puis Enola, puis Coline, puis Brice, puis Anaïs, puis Géraldine, puis Forent.

Comment les universités vont faire pour prendre du monde ? Elles n’ont que trois places chacune. Donc le principe est simple, elles vont mettre ce qu’on va appeler une barre d’admission ; ce concept de barre d’admission va être essentiel par la suite. On compte combien on a de places, on met une barre et puis on dit à ceux qui en-dessous de la barre « désolé on ne peut pas vous prendre, en tout cas pas pour l’instant » et ceux qui sont au-dessus de la barre « tant mieux pour vous, bienvenus, vous êtes pris. » OK ! Donc au départ on les fixe après les trois premières personnes dans chacune des deux formations puisqu’elles sont chacune trois places.

Si vous regardez bien vous vous apercevez que de toutes les personnes qui sont prises, en fait, il y en a une, Coline, qui était prise dans deux formations. D’accord ! Donc puisqu’elle est prise dans deux formations elle va se désister d’une des deux. Il se trouve que dans le tableau où j’avais donné les préférences, elle préférait aller dans la formation F2, donc elle va se désister de F1. Donc on a cette situation-là où j’ai barré Coline sur la formation F1, elle est dans la formation F2, j’ai mis en gras juste pour montrer qu’elle faisait ce choix-là, et puis, à partir de là, qu’est-ce qu’on constate ? On constate que dans la formation F1, il n’y a que deux étudiants alors qu’il y a trois places. Donc on va baisser la barre ; quand il reste des places dans une formation on baisse la barre. Donc ici je baisse la barre et là je peux admettre David. OK !
Et là David, vous voyez qu’il a le choix entre deux formations, il se trouve qu’il préférait F1 ; donc il va démissionner de F2. Il démissionne de F2 ; il n’y a plus que deux personnes dans la formation F2, donc on peut baisser la barre. Ici on arrive à une situation où il y a Anaïs, Brice, David dans la formation F1 ; Enola, Coline, Brice admis dans la formation F2. Brice a un choix à faire entre les deux, il se trouve qu’il préférait F2, donc il démissionne de F1, ce qui libère une place en F1, donc on baisse encore la barre. Et puis là, il y a trois personnes qui sont prises dans F1, il y a trois personnes qui sont prises dans F2 et, si je ne dis pas de bêtise, il n’y a personne qui est en commun entre F1 et F2. OK ! Donc les formations sont remplies, il n’y a plus de désistement possible ; quand il n’y a plus aucune démission, la liste des candidats est épuisée, on s’arrête. D’accord ? Et là ça y est, les universités ont fait le plein. Si vous regardez les candidats qui restent, eh bien dans les candidats qui sont en dessous de la barre pour F1, il y a Enola mais elle a eu une place dans F2 ; il y a Géraldine qui n’est pas prise dans F1, elle n’est pas prise non plus dans F2 ; il y a Anaïs qui n’est pas prise dans F2 mais qui était prise en F1 et Florent qui n’est pas pris dans F2, mais il était pris en F1. Donc en fait il y a Géraldine, simplement, qui n’est prise nulle part. OK !

Cette procédure a un gros défaut, c’est qu’elle est lente, parce qu’à chaque fois que l’université reçoit une démission elle va baisser sa barre et elle va informer un nouveau candidat que la barre a baissé et que maintenant il est pris. Et elle va attendre. Le candidat, s’il ne lui répond rien, eh bien elle va laisser la barre comme ça. Si le candidat lui dit « je démissionne parce que finalement je préfère ce que j’ai déjà », elle va de nouveau baisser la barre. Donc vous avez tout un jeu d’échanges qui a lieu, un jeu d’échanges de messages entre les universités qui disent aux candidats « finalement on peut vous prendre » et les candidats qui disent « finalement je ne suis pas intéressé ».
Si vous prenez par exemple Brice, il était premier sur la liste d’attente, sur une des listes d’attente, mais il a fallu qu’il y ait deux désistements avant qu’il soit pris. Parce que pour que la barre baisse, la barre qui était juste au-dessus de lui baisse, il a fallu qu’elle baisse d’abord de l’autre côté, que ça libère une première place dans l’autre formation, puis une deuxième place qui a permis à quelqu’un qui était devant Brice, dans la formation qui l’intéressait, de se désister. Donc même si vous êtes en tout début de liste d’attente, ça peut être très long avant que la barre baisse suffisamment pour que vous soyez pris.

Ce système, dans la réalité, ce qui se passe pour de nombreux candidats, c’est qu’ils attendaient tout l’été, dans les années 80, une réponse qui peut-être ne venait jamais parce que oui, ils étaient sur liste d’attente, mais il se trouve qu’il n’y a pas assez de désistements. Donc ils ne savent pas, ils sont dans l’incertitude tout l’été, ce qui est assez angoissant.

Un autre truc qui arrive aussi pour les étudiants les plus pauvres, c’est que quand vous ne savez pas si vous allez être à Dijon, à Strasbourg, à Toulouse, à Saint-Étienne l’année prochaine, vous dites qu’il faut chercher quand même un logement. À moins que vous n’ayez du monde de votre famille dans toutes ces villes-là, il faut chercher un logement. Vous savez très bien que si vous cherchez un logement à la fin de l’été ça va être beaucoup dur de le trouver à un prix raisonnable qu’au début de l’été. Donc si vous n’avez pas trop les moyens, vous allez avoir tendance à dire « aujourd’hui j’ai une proposition ; il y avait d’autres choses qui me plaisaient plus, mais je vais me fixer sur cette proposition parce que là, aujourd’hui, au 11 juillet, je peux trouver un logement, alors que si je cherche au 31 août, je n’aurai pas les moyens de me payer un logement ». Je n’ai pas de statistiques précises là-dessus, mais je suis convaincu qu’il y a un certain nombre d’étudiants qui sont obligés de se décider à un moment et qui finissent par se décider alors qu’ils auraient pu avoir quelque chose de mieux s’ils avaient continué à attendre.
Ça c’est une conséquence directe de la lenteur du processus.

Est-ce qu’on peut accélérer le processus ? Toute la question c’est est-ce qu’on peut accélérer le processus ? La réponse est en fait assez simple, il y a une solution toute bête pour accélérer le processus, c’est ce qu’on appelle la hiérarchisation des vœux par les candidats. C’est-à-dire que si chaque candidat annonce dès le départ quel est l’ordre de ses vœux au lieu juste de postuler sur trois universités, il dit « je postule sur ces trois universités, mais celle-là c’est ma préférée ; si je ne l’ai pas, je veux celle-là et si je n’ai aucune des deux, je préfère celle-ci ». D’accord ?
Il y a plusieurs intérêts au fait que les candidats hiérarchisent.
Il y a un premier intérêt, en tant que candidat ça ne vous intéresse peut-être pas, mais c’est quand même intéressant pour l’État, c’est que ça permet de faire des statistiques. Quand vous avez fait cinq vœux, on sait finalement que le vœu que vous avez classé cinquième, s’il n’y a pas trop de places dans la cinquième formation ce n’est peut-être pas grave parce que, finalement, elle n’est qu’en cinquième vœu ; ce qui serait peut-être important c’est plutôt d’augmenter le nombre de places sur la formation que vous avez classée en numéro 1. Donc en termes de possibilité de faire des statistiques pour l’État, sur l’écart entre l’offre de formation et la demande de formation, c’est un point qui me paraît très important.
La deuxième chose qui est importante, une fois que vous avez hiérarchisé vos vœux, c’est qu’on peut simuler le processus. C’est exactement ce qu’on a fait tout à l’heure avec la petite simulation que je vous ai faite tout à l’heure. Je vous ai dit à chaque fois que tel ou tel candidat démissionnait parce que je savais quel était l’ordre de ses vœux. S’il avait fallu que je les appelle à chaque fois pour savoir quel était l’ordre des vœux, on n’avait pas le temps de terminer la présentation !
Et il se trouve que c’est rapide en pratique. Si vous prenez un million de candidats, ce qui est à peu près l’ordre de grandeur pour Parcoursup, on est à plus de 800 000 candidats, plus de 800 000 bacheliers, que vous supposez que chaque candidat fait 100 vœux, ce qui est nettement plus que ce qui est autorisé dans Parcoursup et vous faites tourner ça sur l’ordinateur portable que j’ai là, qui est plutôt vieillissant, il a cinq ans, ça se fait en trois minutes ; c’est l’ordre de grandeur, trois à cinq minutes.
Donc en termes de calcul, c’est extrêmement facile si on veut le faire.
Puisque c’est très rapide, eh bien on peut faire ce calcul. Si les candidats expriment l’ordre de leurs vœux, s’ils hiérarchisent leurs vœux, on peut faire ce calcul et dès qu'on a tous les vœux et dès qu’on a tous les classements, on peut annoncer où on met les barres d’admission et chaque candidat sait qu’il est pris sur le vœu qu’il préfère parmi tous ceux où il est au-dessus de la barre d’admission.

Ça va à peu près pour tout le monde ? Oui ? N’hésitez pas si vous avez des questions, si ce n’est pas clair. Mon objectif c’est que tout le monde puisse comprendre ce mécanisme d’ici la fin de cette conférence. Donc c’est bon ? Je poursuis.

Si on regarde, puisqu’on parlait de retourner vers le futur, historiquement la problématique n’est pas nouvelle. Il y a un article qui date de 1962, qui a été écrit par des mathématiciens qui s’appelaient Gale et Shapley, un article qui s’appelle College Admission and The Stability of Marriage1 qui explique exactement ça. D’accord ?

C’est à peu près ce que fait APB, ce que faisait APB. C’est-à-dire qu’il demandait à chaque candidat quels étaient ses vœux et puis il demandait de classer les vœux. Et une fois que les vœux étaient classés et que les formations avaient fait le classement de leurs candidats, il moulinait et il donnait un résultat. Ils reprennent dans APB ce que je vous ai montré précédemment. C’est à peu près la même simulation, c’est une reprise de cet article de Gale et Shapley de 1962, qui est présentée un petit peu différemment dans l’article de 1962 mais c’était le même principe, sauf que APB ne vous disait pas quelle était la barre d’admission. Il regardait les barres d’admission et puis il disait « votre meilleur vœu dans lequel vous êtes au-dessus de la barre d’admission c’est celui-là, vous êtes pris sur celui-là ».

Donc les résultats étaient essentiellement en une fois.
Pour ceux qui connaissent APB, ce n’est pas tout à fait vrai ; il y avait trois phases d’APB, trois tours. Au premier tour vous aviez les résultats et puis il se trouve que le premier tour avait lieu avant le bac ; parmi les candidats il y en a qui ratent leur bac ; il y en a qui se disent « ah ben tiens, finalement je vais aller étudier à l’étranger » ou « tiens, je vais aller étudier dans telle formation » qui est une formation qui n’est pas dans APB, qui est une formation privée, qui n’a rien à voir avec APB, donc ils sortaient du système. Donc on faisait un deuxième puis un troisième tour pour gérer le fait qu’il y a des candidats qui démissionnaient alors qu’ils avaient des choses dans APB, parce qu’ils préféraient des choses qui étaient hors APB. Mais essentiellement, les résultats principaux, je n’ai pas revérifié les statistiques, essentiellement la plupart des gens savaient où ils allaient lors de la première phase d’APB. Donc il y avait deux tours supplémentaires pour gérer les départs du système.

Parcoursup. Qu’est-ce qu’a fait Parcoursup ?
Il y a eu une décision de la ministre, en juillet 2017, qui a dit « il ne faut pas hiérarchiser les vœux. Les candidats ne doivent pas dire quel est l’ordre de leurs vœux ». C’est une décision qui, personnellement, m’a paru absurde il y un an ; c’est ce qui m’a fait creuser cette question de l’affectation pour essayer de regarder ce qui se passe scientifiquement. Ça me paraît toujours absurde aujourd’hui. Ce qui me rassure c’est que ça paraît absurde aussi à tous les spécialistes de la question et, malheureusement, la ministre a répété que ça faisait partie du principe de Parcoursup. Moi je ne comprends pas en quoi le fait de ne pas hiérarchiser les vœux ça fait partie du principe. Elle a expliqué que ça donnait plus de liberté aux étudiants, enfin aux bacheliers. Moi je ne comprends pas comment le fait d’attendre tout l’été une réponse et de devoir se connecter tous les jours pour vérifier ça donne plus de liberté. J’ai l’impression ou bien que je suis un imbécile ou bien que la ministre nous prend pour des imbéciles !

Ça a une conséquence qui me paraît assez grave en termes de politique publique, c’est qu’il n’y a plus de statistiques. Quand un étudiant a fait dix vœux, s’il a reçu deux propositions sur deux vœux, on ne sait pas si c’était son neuvième et son dixième vœux et qu’en fait il n’est pas content parce que ce n’étaient pas ses vœux préférés, ou si c’était son premier et son deuxième vœux. Et on ne le saura pas puisqu’il n’a dit nulle part quels étaient ses vœux préférés. On pourra juste dire qu’il a eu son vœu préféré parmi les deux propositions qu’on lui a faites. Eh bien oui, normalement il a choisi celui qu’il préférait. Mais c’est à peu près la même chose que dire que 100 % des gagnants au loto ont tenté leur chance. C’est-à-dire que c’est prendre les gens pour des imbéciles !

Donc Parcoursup, le fait de ne pas avoir hiérarchisé les vœux, évidemment ça fait cette longue attente pour les bacheliers puisque ça a démarré le 22 mai et que tous les jours depuis le 22 mai, ceux qui n’ont pas encore eu tout ce qu’ils voulaient sont obligés d’aller continuer à regarder. Et ils le regardent en général tous les jours. Et pire que ça, c’est une angoisse quotidienne des résultats. C’est-à-dire que le problème ce n’est pas juste d’attendre. Si vous attendez vos résultats du bac vous savez que, quand vous avez passé le bac, vous savez qu’une semaine ou deux semaines après vous aurez les résultats. Mais vous n’allez pas regarder tous les jours pour savoir si vous avez vos résultats du bac !
J’ai des collègues dans le secondaire qui ont vu leurs élèves les premiers jours qui étaient toutes les heures en train de regarder sur leur téléphone portable, pour regarder s’ils avaient de nouvelles propositions. Apparemment ce n’était pas suffisamment clairement expliqué sur le site que ce n’est remis à jour qu’une fois par jour, enfin toutes les nuits. Mes collègues l’ont expliqué aux élèves ; ça a permis aux élèves de stresser un petit peu moins ; ça a permis aussi qu’ils écoutent un petit peu plus les cours. Mais vous imaginez que quand on est dans une situation de stress comme ça, quotidienne, ça ne facilite pas le travail intellectuel et donc c’est quelque chose qui est extrêmement difficile et pour les enseignants et pour les élèves toute la période entre le 22 mai et puis le bac.

Pour moi c’est un retour non pas vers le futur mais vers le passé, en 1985. Donc c’est assez dramatique qu’on en arrive là. C’est vraiment utiliser l’informatique pour revenir à un truc pré-informatique.

On peut se poser les questions : qu’est-ce qu’on pourrait faire comme système d’affectation dans lequel on puisse avoir un minimum confiance, sans parler directement d’APB ou de Parcoursup ?
Il y a un certain nombre de conditions, là j’en ai listées huit, il y en a peut-être d’autres. Je les ai listées, en fait, parce que j’ai remarqué que sur APB et sur Parcoursup, il pouvait y avoir des problèmes là-dessus. Je ne vais pas toutes vous les lire maintenant, simplement les deux premières.
C’est le fait qu’on ait un algorithme public et compréhensible et qu’on spécifie clairement ce qu’on veut.
Je vais commencer par la question de l’algorithme.
Pour APB l’algorithme était soi-disant publié. Le ministère, suite à des demandes de droit des lycéens notamment, a publié un algorithme ; il l’a publié sous la forme d’une page, je crois que c’était une page A4, avec un joli dessin. Tous les informaticiens ont trouvé que c’était grotesque. Ce n’était pas un algorithme ; c’était juste un truc qui expliquait vaguement les choses. En réalité l’algorithme est resté relativement secret mème si, à priori, il semble que ce soit l’algorithme que j’ai présenté précédemment.

Pour Parcoursup il y a quand même un progrès, un progrès indéniable, c’est qu’il a été publié de façon détaillée, il a été publié d’ailleurs sur Framagit2 comme le disait Pyg [Pierre-Yves Gosset] hier. Donc c’est un progrès.

Après, la question, ce n’est pas juste un algorithme. Un algorithme ça répond à une question ; ça répond à la question comment on fait quelque chose ? La première question à se poser ce n’est pas comment on fait, c’est qu’est-ce qu’on veut faire ? Et ça, c’est ce qu’on appelle une spécification. Un algorithme ça n’a pas de sens si ça ne répond pas à une question posée et, si possible, il faudrait que cette question, cette spécification, ce qu’on veut faire, ce soit dit clairement. Pour moi le problème c’est que si on regarde APB comme Parcoursup il n’y a pas eu de spécification qui a été publiée : c’est censé affecter les bacheliers dans l’enseignement supérieur, mais on ne sait pas comment ; c’est censé plus ou moins utiliser un classement, on ne sait pas bien comment.

Alors moi je proposerais bien une spécification qui est assez naturelle, qui est la suivante, qui est de dire : on va avoir ce mécanisme avec des barres d’admission, le classement avec des barres d’admission et ce qu’on veut c’est que les barres d’admission soient fixées en respectant la capacité des formations ; il ne s’agit pas de dire on admet tout le monde dans toutes les formations puisque qu’il n’y a pas assez de places pour tout le monde dans toutes les formations. Donc il faut respecter la capacité des formations et il faut mettre quand même les barres aussi bas que possible de façon à admettre le maximum de gens. Plus les barres sont basses, plus vous avez de choix, à priori, dans les vœux que vous avez proposés, plus vous aurez vos premiers vœux.

Et puis il y a une autre chose qui est importante, j’en parlerai un petit peu plus tard, c’est que ce serait bien que le système n’incite pas les étudiants, enfin les bacheliers, à mentir sur leurs préférences. Il y a des situations où vous pouvez avoir intérêt à mentir pour que ça marche mieux pour vous, mais c’est assez dramatique en termes de statistiques parce qu’on ne sait pas ; si les gens se mettent à mentir on ne sait pas ce qu’ils voulaient réellement.

Il se trouve qu’il y a un vrai problème derrière ici, c’est que les barres d’admission dans APB et dans Parcoursup ne sont pas aussi basses que possible et, en plus, le système peut inciter à mentir dans certains cas.

Je vais montrer ce que ça donne. On reprend l’exemple précédent.
L’exemple précédent on s’était arrêtés là, c’est-à-dire que la barre pour la formation F1 descendait après le cinquième candidat et la barre pour F2 descendait après le quatrième candidat. Et ça marchait bien puisque dans F1 il y avait deux démissions, dans F2 il y avait une démission, et donc il n’y avait que trois personnes qui allaient dans chaque formation.
En fait l’algorithme s’arrêtait là puisqu’il n’y avait plus de démissions. Pourtant on aurait pu faire mieux ! Si vous regardez Enola, vous remarquez qu’Enola n’est pas prise, elle est première sur liste d’attente sur F1 et elle est prise dans F2, mais en fait elle préférait F1. D’accord ? Et Anaïs est première sur liste d’attente dans F2, elle est prise sur F1, mais elle aurait préféré F2. Et l’algorithme, là, est bloqué. D’accord ! Et si on avait descendu un tout petit peu plus les barres, comme ça, eh bien Anaïs aurait eu le choix entre F1 et F2 et elle aurait démissionné de F1 ; et Enola aurait eu le choix entre F1 et F2, elle aurait démissionné de F2.
Donc finalement il y aurait eu trois personnes dans F1, trois personnes dans F2, ça marchait aussi, mais en plus Anaïs et Enola étaient plus contentes qu’avec la situation précédente.

En fait, l’algorithme qui est utilisé par APB et par Parcoursup ne met pas les barres d’admission de façon optimale ; il les met comme on le faisait dans les années 80 en baissant les barres petit à petit parce qu’on ne pouvait pas faire mieux, parce que c’était chaque université qui faisait ça dans son coin et que c’était la façon naturelle de faire.

On peut se poser la question : est-ce qu’il y a une façon systématique de mettre ces barres d’admission de façon optimale ? Est-ce que ça c’est optimal ou pas et est-ce qu’il y a une façon de le faire ?
La réponse est oui et la réponse non seulement c’est oui, mais elle est connue depuis 1962. C’est toujours l’article de Gale et Shapley de 1962 qui explique comment on peut faire ça. Il le présente un petit peu différemment qu’avec les barres d’admission, il utilise une métaphore qu’on appelle la métaphore des mariages stables, mais c’est vraiment les mêmes idées.

Donc il y a deux algorithmes. Il explique qu’il y a l’algorithme classique qu’on appelle COSM qui est celui d’APB et de Parcousup et puis il explique qu’il y a l’algorithme qui est optimal pour les étudiants qu’on appelle SOSM.
SOSM, c’est très simple. Comment ça marche ? On fait un truc qui est complètement contre-intuitif. Au lieu de mettre les barres de façon prudente au début et de les baisser, on les met le plus bas possible et puis on se dit « ah zut, on les a mises trop bas » et on les remonte tant qu’il y a besoin de les remonter.

Exemple : vous fixez les barres ici. Si vous fixez les barres là, qu’est-ce qui va se passer ? On calcule les démissions. Vous calculez les démissions, c’est toujours avec les mêmes préférences pour les étudiants, vous calculez les démissions, vous vous apercevez que dans F1, finalement, il n’y a plus que deux personnes, F1 n’est pas plein, ce n’est pas dramatique mais c’est dommage. Mais surtout, ce qui est très gênant, c’est que dans F2 il y a cinq personnes et donc ça, ça ne va pas. D’accord ? Il y a trop de monde. Puisqu’il y a trop de monde dans F2, qu’il y a deux personnes de trop dans F2, on va remonter la barre dans F2 de deux crans. Une fois qu’on a remonté la barre, on recalcule les démissions. Là qu’est-ce qu’on voit ? Dans F2 c’est bon, il y a trois personnes. Mais dans F1, cette fois-ci, il y a un petit moins de démissions et dans F1 vous avez quatre personnes au lieu de trois. Ce n’est pas grave ! Enfin ce n’est pas grave, ce serait gênant, donc on va remonter la barre d’admission de F1 et on recalcule les démissions.
Ici tout va bien : il y a trois personnes dans F1, trois personnes dans F2.

Cet algorithme est complètement général. Ce mécanisme-là marche très bien, on peut le simuler informatiquement, et ça vous garantit de mettre les barres le plus bas possible. C’est expliqué dans l’article de 1962 de Gale et Shapley.

Cet algorithme SOSM, ce n’est pas purement théorique. Aux USA il est utilisé depuis 1998 pour les internats de médecine. En Écosse il est apparemment utilisé, alors je ne sais pas depuis quelle date, pour l’affectation des jeunes médecins. En Espagne il est utilisé aussi pour l’affectation des bacheliers. En Hongrie, ce qui est intéressant c’est qu’ils avaient commencé par l’algorithme qui était le même que celui d’APB et de Parcoursup, COSM, et puis, en 2007, ils se sont aperçus, il y a quand même quelqu’un qui a dû dire « ah ! oui, mais ce n’est pas le bon algorithme », donc ils sont passés à SOSM. Et ça fait plus de dix ans, apparemment, personne n’a demandé à changer depuis.

Donc en résumé ce que fait Parcoursup n’est pas clairement spécifié ; on peut le spécifier.
Il y a un algorithme qui est l’algorithme optimal qui est bien connu depuis 56 ans, à peu près, mais c’est assez triste de voir qu’il n’est pas utilisé. D’accord ? Ça va sur ces points ?

Donc ça c’était sur les points d’algorithmique, la question de l’algorithme et la question de la spécification. Ce ne sont pas les seuls.

Une fois que vous avez un algorithme il faut le mettre en œuvre. Quand vous devez le mettre en œuvre, il y a des conditions à respecter pour le mettre en œuvre. On appelle ça des préconditions informatiquement. C’est quoi une précondition ? C’est une condition préalable à l’exécution d’un algorithme ou d’un programme.

Pour les algorithmes de Gale et Shapley, les deux algorithmes, il y a une précondition qui est importante c’est que l’ordre des vœux des candidats ne doit pas être un critère de classement. Quand les formations classent leurs candidats, elles ne doivent pas dire celui-là on va le placer mieux que l’autre parce qu’ils ont d’aussi bons dossiers, mais celui-là nous a classés en premier alors il est sans doute plus sympa avec nous. Ça c’est interdit si vous voulez que l’algorithme de Gale et Shapley marche correctement.

Dans APB, il y avait un truc qui existait qui était les bonus « premier vœu ». Sur certaines formations vous pouviez avoir un bonus sur certains vœux si c’était votre premier vœu. Qu’est-ce que ça veut dire ? Ça veut dire que, imaginons que vous voulez postuler, je ne sais plus quelles étaient exactement les formations concernées, mettons que ce soit une formation de médecine. Vous voulez postuler en médecine, si vous êtes moyen, vous avez un dossier moyen – alors c’est un peu plus compliqué que ça parce que ce n’était pas sur le dossier –, mais disons que vos chances étaient moyennes et, si vous êtes en premier vœu, vous allez avoir un bonus donc ça va augmenter fortement votre chance d’être pris.
Donc imaginons la situation suivante, vous avez deux formations qui vous intéressent : une première formation qui vous intéresse bien mais vous n’êtes vraiment pas sûr du tout d’être pris ; et puis la deuxième c’est médecine et puis là vous êtes un peu juste, un peu moyen, vous dites que ça risque d’être tangent. Qu’est-ce que vous avez intérêt à faire ? Eh bien si vous exprimez vos vœux de façon tout à fait honnête, vous risquez de ne pas être pris sur la première formation et puis quand vous allez arriver sur médecine vous allez vous faire passer devant par tous ceux qui avaient mis médecine en premier vœu. Donc vous avez peut-être intérêt à mentir ; à dire « je m’autocensure et je ne mets pas mon premier vœu sur l’autre formation, je mets comme premier vœu médecine parce que là j’ai un dossier moyen mais, avec en plus le premier vœu, je suis sûr d’être pris ». OK ! Vous voyez l’idée ? C’est-à-dire que vous aviez intérêt, dans certaines situations, non pas à répondre honnêtement mais à répondre de façon stratégique.

Donc ça veut dire que vous avez intérêt à ne pas donner vos vraies préférences contrairement à ce qu’était annoncé. C’était annoncé, dit et redit « exprimez vos préférences librement et honnêtement », eh bien ce n’était pas forcément une bonne idée !

Ça fausse les statistiques. Évidemment puisque les préférences ne sont pas les vraies préférences. Et qui est-ce que ça favorise ? Ça favorise les gens qui savent jouer stratégique. Et qui sont les gens qui savent jouer stratégique ? Eh bien ce sont les enfants de catégories socioprofessionnelles supérieures et les enfants de profs qui connaissent bien le système.

Je parlais tout à l’heure de liberté, égalité, fraternité, l’égalité en prend un coup !

Dans Parcoursup la solution est radicale. Je ne sais pas si c’est pour cela qu’il n’y a plus de hiérarchisation des vœux, mais la solution est radicale : il n’y a plus de hiérarchisation des vœux donc, de toutes façons, il n’y a plus de premier vœu, donc il n’y a plus de bonus premier vœu. Enfin ce n’était peut-être pas la peine de jeter le bébé avec l’eau du bain, ou l’APB avec l’eau du bain, je ne sais pas comment il faut dire.
Et puis évidemment, casser la hiérarchisation des vœux ça veut dire qu’il n’y a plus de statistiques ; ça veut dire qu’on ne pas utiliser l'algorithme SOSM, parce qu’on ne va pas s’amuser à dire aux étudiants « on place les barres en bas, on vous dit que vous êtes admis partout, c’est quoi votre premier vœu ? » Et puis on regarde et puis on dit : « Ah ben non, en fait il y en a trop qui sont sur telle formation, on vous dégage de votre premier vœu, c’est quoi le vœu suivant ? » Ça ferait quelque chose d’assez horrible. Donc ici, sur Parcoursup, on a toujours cette attente interminable.

L’algorithme c’est une chose ; la spécification c’est une chose. Mais après, une fois qu’on a spécifié, il faut implanter le programme ; il faut écrire le code et les informaticiens savent bien que le diable est dans les détails. Quand on écrit un programme, il suffit d’une toute petite erreur pour qu’il y ait un bug. Donc c’est important de savoir comment est réalisée l’implantation du programme, le code du programme.

Le code d’APB n’a pas été publié, sauf une toute petite partie qui est le tirage au sort sur lequel le ministère a publié 20 pages, ça fait à peu près 20 pages qui ont été envoyées par courrier papier ; ils l’ont fait de très mauvaise grâce et ils ont envoyé un courrier papier où le code est formaté de façon absolument horrible. Ça ne fait vraiment pas honneur à ceux qui ont programmé ça derrière, la façon dont c’est présenté.
Et puis ce code dépend d’Oracle, qui est un logiciel privateur, c’est une grosse base de données mais qui est une boîte noire, donc le code est une boîte noire.

Dans Parcoursup il y a eu un progrès indéniable, c’est que le cœur de l’algorithme est publié. Il a été publié le 21 mai 2018 sachant que les premiers résultats étaient le 22 mai. Et ce programme dépend aussi d’une base qui tourne sous Oracle.
Ce n’est vraiment que le cœur de l’algorithme qui a été publié, tout le reste n’a pas été publié et il peut y avoir des surprises dans le reste.

Moi ce que j’aimerais bien un jour c’est qu’il y ait une implantation qui soit publiée un peu avant l’utilisation comme ça on aurait le temps de regarder si elle est correcte ou pas avant l’utilisation.
Quelle soit publiée en intégralité parce que, encore une fois, le cœur de l’algorithme est publié. On peut se convaincre, sans doute – je n’ai pas eu le temps moi de le lire ; le cœur de l’algorithme, l’implantation correspondante est publiée ; on peut se convaincre que l’implantation correspond à peu près à l’algorithme, mais il y a plein d’autres choses autour, il y a plein de manipulations de données autour sur lesquelles il y a des possibilités d’erreurs.
Et puis j’aimerais bien qu’un jour ce soit publié uniquement sous forme de logiciels libres pour que n’importe qui puisse facilement essayer le programme lui-même pour voir si ça tourne bien.

Une fois qu’on fait tourner un gros processus comme ça, il y a aussi toute la phase d’exploitation du système. Donc il faut gérer rigoureusement le processus.
Ce que vous avez là ce sont quelques petits témoignages de problèmes que j’ai vus sur APB.
Par exemple, du côté des classes prépa on récupère un gros fichier de tableur avec la liste des candidats et leurs notes et puis différentes informations comme est-ce que l’étudiant est boursier ou pas ? Combien de parts de bourse il a ? À quelle distance il habite de la formation sur laquelle il postule ? Et puis il y a des informations du type est-ce qu’il a demandé l’internat ou pas ?

Donc comment ça marche ? Comment ça marchait ? Le 27 avril, en 2013, j’ai téléchargé ce fichier tableur et puis il y avait une colonne à remplir qui était comment on classe les étudiants : en face de chaque étudiant on met si on le classe un, deux, trois, etc. et puis on renvoie ça ; je renvoie ça le 24 mai ; on a fait ça avec des collègues pour trier les dossiers, on a pris à peu près un mois, et puis quand je renvoie ça, le site web me dit : « Ah là, dans telle colonne, tel endroit, vous avez un code qui n’existe pas ; votre code est inexistant ». J’ai regardé, je me suis dit « tiens c’est bizarre, est-ce que c’est moi qui l’ai rajouté ? » J’ai repris le fichier que j’avais téléchargé le 27 avril ; il était déjà là ce code. Donc j’ai fini par contacter le service d’APB par téléphone. Ils me disent : « C’est normal, ce code on l’a changé ; il n’existe plus. » Il existait le 27 avril mais le 24 mai il n’existe plus. Ils n’ont pas eu l’idée qu’ils pouvaient peut-être le changer plutôt en octobre et faire des essais en octobre, en septembre et que là ce n’était peut-être pas le moment pour toucher au bazar ; ça ne fait pas très sérieux.

En 2014, le 5 juin, non le 12 juin pardon, on avait déjà renvoyé tous nos classements et puis là on reçoit un petit mail d’APB disant : « Ah vous allez rire, on s’est trompés dans la colonne qui donne les parts de bourse, mais on est gentils on vous laisse cinq jours pour refaire tous vos classements ». Heureusement, il se trouve que nous on ne l’avait pas prise en compte cette colonne, on avait pris une autre colonne qui parlait aussi des critères sociaux pour l’accès à l’internat, mais sinon moi ça ne m’aurait pas fait rire du tout !

En 2015, il y a une colonne qui donne quelle est la distance du domicile de l’élève à la formation. Quand quelqu’un est à 500 kilomètres on va plutôt le favoriser pour l’internat par rapport à quelqu’un qui est à trois kilomètres. Et ce champ s’appelait « kilomères », c’était une faute d’orthographe ; en 2014 il s’appelait « kilomères » ; en 2013 je crois qu’il s’appelait « kilomères » aussi. Et puis en 2015, j’ai téléchargé le fichier un jour et puis quelques jours après, en fait ce n’était plus « kilomères », c’était « kilomètres » ; ils avaient jugé que c’était une correction tellement importante à faire, ils avaient quand même mis deux ans avant de se rendre compte qu’il y avait un petit bug là, mais ils l’ont fait tout de suite, ça ne pouvait pas attendre septembre ! Donc là encore ce n’est pas une gestion sérieuse du processus.

Après ça moi j’ai passé la main, j’ai laissé un autre collègue s’en occuper ; je lis encore les dossiers mais la partie technique de charger le fichier, de le renvoyer tout ça, ce n’est plus moi qui fais.

En 2016 j’ai un collègue qui m’a signalé que, par exemple, on a deux fichiers dans lesquels il n’y a pas les mêmes informations, deux fichiers de tableur, et il y avait deux colonnes qui s’appelaient presque pareil ; on avait l’impression que c’était les mêmes informations, mais elles n’avaient pas tout à fait le même nom ; en fait c’était les mêmes, mais elles n’avaient pas le même nom. Donc là encore ce n’est pas très rigoureux sur la façon de gérer les choses. Voilà !

Pour moi, la cause de tous ces problèmes, c’est que d’abord il y a une complexité qui est inutile. APB et Parcoursup ce sont des vraies usines à gaz. On pourrait faire des choses, me semble-t-il, plus simples.
Ensuite, c’est qu’il n’y a absence de réflexion vraiment sur ce processus. Les informaticiens qui gèrent ne serait-ce qu’un site web, ils vous expliqueront que normalement ils ont la version de développement et la version de production, quand on fait un truc un peu sérieux. Quand on fait son site web personnel, moi j’avoue que je n’ai pas ma version de développement et de prod. Mais quand on gère quelque chose qui doit gérer de l’ordre d’un million d’étudiants, il faudrait être un petit peu sérieux sur le processus.
Et une possibilité aussi c’est qu’il n’y a jamais eu de moyens sérieux alloués, je pense, à ça. APB, je crois que c’est moins d’une dizaine de personnes qui travaillent sur la partie informatique, me semble-t-il. Je n’ai plus les sources précises là-dessus.

On a parlé d’implantation, de gestion du processus et après il y a une autre question qu’on peut se poser, qui va plus loin, c’est que vous exécutez un programme sur un ordinateur. Je ne sais pas si vous avez entendu parler des problématiques d’ordinateurs de vote par exemple. Quand vous avez une machine à voter, vous votez et puis vous avez un résultat au bout. On peut toujours vous dire « le logiciel qui tourne sur la machine de vote c’est un logiciel libre, regardez, voilà son code », mais qu’est-ce qui vous prouve que le code qui est sur la machine c’est celui qu’on vous a donné ? À priori rien ! Donc vous ne pouvez pas être sûr que le code qui tourne est le bon. Vous ne pouvez pas non plus sûr être que le PC qui exécute le code n’a pas un problème. Que ce soit le fait qu’il est défectueux, que ce soit le fait qu’il est vérolé. Défectueux ça arrive : il y a eu un cas de machine de vote où on sait qu’il y a eu une erreur sur le comptage des votes ; il y a eu 4096 votes en trop enregistrés. Pourquoi 4096 ? Parce que ça correspond exactement à ce qui se passe quand on change un bit, de 1 à 0, et l’explication c’est qu’il y a eu une petite erreur physique, un rayon cosmique qui a dû arriver, qui a changé un bit ; ça se produit rarement mais ça peut se produire et ça a changé le résultat. Comment vous pouvez vérifier que là ça s’est bien passé ? On ne sait pas.

Et puis vous ne pouvez pas vérifier non plus que les résultats qui sont publiés sont bien sont qui ont été calculés. S’il y a quelqu’un qui récupère les résultats calculés et puis qui change pour remonter un copain, eh bien vous ne le saurez jamais ! D’accord ?

C’est une problématique qui est très difficile, qui n’a pas vraiment de solution en l’état actuel de la science, mais la science a quand même des réponses à ces questions-là. Les réponses de la science à cette question de l’expérimentation ça a été le critère de reproductibilité. Si vous voulez que quelque chose soit une expérience scientifique il faut montrer que vous êtes capable de reproduire l’expérience et que ça va donner le même résultat. Donc on pourrait exiger, par exemple, que les résultats soient reproduits par une commission de contrôle indépendante avec un matériel, un système d’exploitation différents, avec éventuellement une implantation différente.

Et puis on pourrait même espérer mieux, c’est que les données soient ouvertes ; c’est-à-dire que les données d’APB on les publie, éventuellement en anonymisant les données pour qu’on ne sache pas, on met un numéro d’anonymat à chaque candidat ; on publie les données et n’importe qui peut rejouer l’exécution du code d’APB ou de Parcoursup pour recalculer les données et vérifier que ça donne bien les mêmes choses. Et ça, il me semble que c’est indispensable pour qu’on puisse avoir confiance dans le résultat.

Il se trouve que la publication des données même anonymisées, il n’y en a pas eue à ma connaissance dans APB ; il n’y en a pas eu non plus dans Parcoursup. Ce serait pourtant quelque chose d’intéressant me semble-t-il.

Évidemment on peut se dire est-ce qu’il n’y a pas des problématiques de données personnelles, en publiant tout ça ? D’une part on pourrait essayer d’anonymiser un peu et, d’autre part, si vous regardez tous les concours officiels de l’État, les résultats sont publiés officiellement. Donc ce n’est pas quelque chose qui, en tout cas moi me paraît choquant à priori.

Un autre problème qui peut se poser ce sont tous les problèmes légaux et notamment le droit d’accès et de rectification qui étaient prévu dans la 78-17 du 6 janvier 1978, qu’on appelle la loi informatique et libertés familièrement, qui a été complétée par le RGPD [Règlement général sur la protection des données] ; j’avoue que je n’ai pas eu le temps de me plonger vraiment dans le RGPD, mais essentiellement ce que vous dit cette loi, c’est que quand vos informations sont traitées par un système informatique, vous avez le droit de vérifier si elles sont rentrées correctement et vous avez le droit de demander à ce qu’elles soient corrigées. Dans APB et dans Parcoursup ce n’est pas vraiment un droit qui existe. Je vous donne des exemples.
Il y a des situations où vous avez un élève de terminale qui candidate sur APB, en tout cas j’ai vu sur APB, et son lycée ne remonte pas toutes les notes : il oublie de mettre sa note de Sciences physiques, ou il oublie de mettre… J’ai vu des situations où il y avait une note de Sciences pour l’ingénieur qui était mise et il n’y avait pas le rang dans la classe. On savait qu’il y avait 35 élèves dans la classe, mais on ne savait pas si le candidat était premier, deuxième, troisième, alors que c’est une information qu’on avait pour tous les autres. Pourquoi ? Parce que c’était un oubli du lycée qui avait fait remonter.
Qu’est-ce qu’on fait nous, quand on a ce genre de dossier ? On n’a pas le droit de contacter les candidats. On n’a pas matériellement je pense, de toutes façons, le temps de faire remonter et de récupérer les informations, donc on dit « on va faire à la louche, il doit être à peu à peu là, donc son dossier il est plutôt bon, il est plutôt pas bon ». Et l’élève, s’il n’est pas pris à cause de ça, parce que l’information n’était pas là, il n’en saura jamais rien. Il pourra juste découvrir qu’il n’est pas pris sur une formation où il pensait être pris. Mais il n’aura même pas, à ma connaissance il n’avait même pas les données et je pense qu’il ne les a toujours pas dans Parcoursup, il n’a toujours pas précisément les données qui sont dans le système le concernant. Donc les candidats ne peuvent pas du tout vérifier.

Dans Parcoursup il y a une toute petite amélioration, c’est que si vous n’êtes pas pris à un endroit, on va vous donner votre rang ; on va vous dire « là vous êtes 300e en liste d’attente » et si vous avez un copain qui est moins bon que vous et que lui est 200e en liste d’attente vous dites « ah, il a dû y avoir un problème » et là vous pouvez essayer de faire un recours ; mais c’est relativement maigre comme information quand même. Et la rectification des erreurs n’est pas prévue dans l’algorithme. Donc la rectification des erreurs ça peut être ce genre de chose : vous appelez et vous aller dire « mais il y a eu une erreur ». Même si on vous fait remonter dans les classements, ce qui à mon avis va être compliqué, au mieux, ce qui va se passer, c’est qu’on va vous dire « on va vous mettre premier sur liste d’attente ; vous deviez être pris, eh bien vous ne serez pas pris, mais on vous met premier sur liste d’attente ; ça vous donne de bonnes chances d’être pris ». Ce n’est pas une rectification complète ! D’accord !

Dans les erreurs, il y a aussi des erreurs qui sont des erreurs humaines. Quand vous êtes obligé d’aller regarder tous les jours sur Parcoursup, il y a un certain nombre de bacheliers qui ne vont pas regarder sur un ordinateur, qui regardent sur leur téléphone portable. Et puis sur un téléphone portable, apparemment, s’ils ne cochent pas exactement au bon endroit, il y a eu un certain nombre de cas de gens qui se sont faits démissionner parce qu’ils n’ont pas dû faire la bonne manip, parce que l’interface n’était peut-être pas assez claire. Donc on voit des gens qui disparaissent et j’ai des collègues qui voient des gens disparaître et puis, tout d’un coup, revenir premier en liste d’attente. Donc c’est un moindre mal d’être premier en liste d’attente, mais c’est quand même un mal.

Et puis, si on voulait vraiment gérer les erreurs, ce serait très compliqué puisque l’évolution est quotidienne. Donc si vous avez quelqu’un qui met deux jours à se rendre compte qu’il y a une erreur, il faut revenir sur les deux jours en arrière ; matériellement c’est extrêmement difficile.
Parcoursup fait tout, enfin fait tout ! est conçu de telle façon que ça sera extrêmement difficile de rectifier les erreurs.

Voilà ! Donc ça c’était un des problèmes. Alors je précise, les erreurs c’est évidemment quelque chose qui est extrêmement fréquent en informatique et c’est pour ça, d’ailleurs, qu’il y a le RGPD, qu’il y a la loi informatique et libertés. Les erreurs de saisie c’est quelque chose d’extrêmement fréquent et qu’il faut prévoir quand on prévoit un programme, quand on écrit un programme.

Autre point qui a fait couler beaucoup d’encre et à juste titre, ce sont les classements locaux.
Je vous disais, en classe prépa on va classer les candidats qu’on a. Moi je suis dans une filière qui s’appelle la MPSI, il y a deux MPSI dans le lycée où je suis, c’est-à-dire qu’on a deux fois 48 places, donc 96 places chaque année et, pour ces 96 places, on a 3000 candidats. Donc on ne va pas regarder de façon détaillée les 3000 dossiers. Qu’est-ce qu’on fait ? On fait un tri informatique soit en utilisant une formule dans un tableur, mais en fait la liste est déjà tellement longue et avec tellement de paramètres que souvent le tableur a tendance à exploser ; soit avec un programme fait maison, avec des critères qui sont des critères maison, qui ne sont pas les mêmes dans tous les lycées. Qu’est-ce qu’on prend en compte ? On prend en compte la note, on prend en compte le rang parce que quelqu’un qui a 16 en maths en étant premier de sa classe, ce n’est peut-être pas pareil que quelqu’un qui a 16 en étant dixième de sa classe sur une classe de 15 personnes.

Ces classements locaux sont faits par les enseignants ; ça coûte cher en temps aux enseignants, mais, j’ai envie de dire, pas en argent à l’Éducation nationale. Parce que les enseignants sont bien gentils, ils font ça bénévolement parce qu’ils savent que sinon ce sera encore plus mal fait ; de toutes façons leur proviseur n’a pas le temps de le faire ; matériellement il n’aurait pas le temps de le faire et il ne saurait pas le faire.

On a des données qui sont relativement peu informatives : si vous prenez deux établissements, une même note dans deux établissements, ça n’a pas la même valeur ; et tous les enseignants sont convaincus. Je peux vous donner l’exemple avec deux établissements, les enseignants vont tous vous dire « il a une moins bonne note dans cet établissement parisien, mais je préfère celui-là que l’autre qui vient de Trifouillis-les-Oies, qui a une très bonne note, mais on ne sait pas trop ce que c’est que son lycée ». Donc ça, ça se fait au jugé. OK ! Traiter de la même façon les deux candidats en faisant abstraction du lycée d’où ils viennent ce ne serait pas vraiment équitable ; les traiter comme ça, au jugé, ce n’est pas forcément non plus très équitable.

Et puis enfin, il n’y a aucun contrôle des conflits d’intérêt. On peut classer ses propres enfants. Moi j’ai eu le cas de mes enfants qui ont postulé dans la MPSI où j’étais. Il se trouve qu’ils sont partis ailleurs, ça, ça me soulage. Et puis j’ai dit à mes collègues « regardez comment ils sont classés, vérifiez bien que je n’aie pas fait de bêtise » ; mais il n’y a aucun contrôle, ce qui n’est pas normal.

Il y a peut-être des recours en justice à venir puisque, je ne sais pas si vous avez vu dans l’actualité, il y a un sénateur, Pierre Ouzoulias, qui demande des informations sur ces classements locaux3 et qui compte bien aller en justice s’il n’a pas de réponse. Il va avoir du mal à avoir une réponse. Si vous demandez à tous les collègues de prépa de publier le logiciel qu’ils ont pour faire leurs traitements, si vous commencez à les étudier tous, je suis qu’il y a un certain nombre de recours en justice qui vont dire qu’il y a des choses qui ne vont pas parce qu’ils ont fait chacun ce qu’ils pouvaient, moi compris, mais on ne peut pas faire les choses parfaitement dans ces conditions. Donc ce qui risque de se passer après c’est que les gens vont dire, les collègues vont dire « écoutez très bien, ce qu’on a fait ça ne va pas, débrouillez-vous et puis vous ferez sans nous ! » Donc ça risque d’être pas mal le bazar. Enfin je ne vois pas bien comment ça va se passer.

Pour les classements locaux, moi j’ai une suggestion qui est toute bête

par mmorandi

April

L'April a pour objectifs de promouvoir et défendre le logiciel libre et ses acteurs.

Public, privé, politique : Internet au 21e siècle - Benjamin Bayart

 -  13 août - 

Titre : Public, privé, politique : Internet au 21ème siècle Intervenant : Benjamin Bayart Lieu : Hack2g2 - Vannes Date : mai 2017 Durée : 1 h 34 min (...)


Nos données personnelles sont-elles vraiment protégées avec le RGPD - En Quête de Sens

 -  11 août - 

Titre : Nos données personnelles sont-elles vraiment protégées avec le RGPD ? Intervenants : Camille Gruhier - Maître François Coupez - Benoît (...)


Comment reprendre le contrôle de notre vie numérique - Tariq Krim

 -  20 juillet - 

Titre : Comment reprendre le contrôle de notre vie numérique Intervenants : Tariq Krim - Guillaume Grallet Lieu : Paris - Le Point Date : mai 2018 (...)


L'idiot du village g00gle - Xavier Coadic - PSES2018

 -  17 juillet - 

Titre : L'idiot du village g00gle Intervenant : Xavier Coadic Lieu : Choisy-le-Roi - Pas Sage En Seine 2018 Date : juillet 2018 Durée : 1 h 03 min (...)


La directive sur le droit d’auteur : désinformation et étude indépendante

 -  4 juillet - 

Ce texte est une traduction réalisée par Copyright for Creativity (C4C) d'un texte (PDF, en anglais) rédigé par l'organisation CREATe et publié le 29 (...)