Ma job

En lisant mon flux d'abonnements sur la Fédiverse, j'ai un peu l'impression qu'il y a beaucoup beaucoup de gens dans l'informatique en général, et le plus souvent en développement ou en administration système & réseau. Bon, nous avons pas mal de libraires et de gens autour des métiers du livre aussi, ça c'est chouette, mais quand même plein d'informaticien·ne. Je n'échappe pas à la règle mais en commençant à aborder mon travail [ici](https://bidule.menf.in/notice/127471) ou [là](https://bidule.menf.in/notice/656728), j'ai l'impression que j'en ai surpris plus d'un·e qui m'imaginais à un poste plus conventionnel dans une S2I ou une startup[^startup].

Alors, c'est vrai, je faisais exactement ça lors de mes deux premiers emplois. J'ai fait une école d'ingé, me suis spécialisée en informatique, guettant toute bonne opportunité de finir dans un labo de recherche mais mes profs — tou·tes chercheur·ses dans le gros labo voisin — ont réussi à m'en éloigner et à me faire croire — temporairement — que je n'étais pas faite pour la recherche. J'ai décroché mon premier poste en tant que développeuse PHP puis j'ai été administratrice système et réseau dans des boîtes tout à fait classiques.

## La transition

Je crois bien que j'y serais restée encore une couple d'années si je n'en avais pas été délogée par le capitalisme et ses contraintes. La boîte qui m'employait ne gagnait plus assez d'argent et a dû se débarrasser de quelques personnes ; côté admins c'est moi qui fus élue pour le grand voyage. Loin de m'affoler, la nouvelle m'est apparue comme l'opportunité d'essayer d'arranger le coup entre la recherche et moi, de nous donner une dernière chance. Il faut dire que je chevauchais alors la vague d'une autre transition qui ne cessait de me remplir de bien-être, de confiance et d'optimisme.

## Ce que je dois faire

Sur ma fiche de poste il est écrit que je suis «ingénieure en base de données». Ça me fait doucement rigoler parce des bases de données, je n'en ai pas vues beaucoup. Dans un précédent [article](/article/Le%20tronçonneur%20des%20Lilas.html), j'ai parlé rapidement de linguistique de corpus. Je pense que c'est ce à quoi faisait allusion la fiche de poste. Les «bases» dont il est question, ce sont les corpus de texte et les métadonnées qui leur sont associées et conservées précieusement. En effet, le genre de l'œuvre, la date de parution de l'œuvre mais aussi la date de l'édition précise que l'on considère sont autant d'éléments cruciaux pour les chercheur·ses qui étudient les textes.

Je travaille avec un chercheur qui m'a recrutée pour 11 mois d'ingénierie sur un projet ANR. C'est mon boss et la seule personne avec qui nous bossons vraiment sur le même projet de manière permanente. Pour lui je suis un peu la «Gardienne du Corpus». C'est moi qui garantis l'état du corpus, qui prépare les archives qui passent dans notre chaîne d'annotation morpho-syntaxique[^autre_article], qui fais tourner la dite chaîne et qui lui livre des archives sur-mesure pour importer dans le logiciel d'analyse qu'il utilise : [TXM](http://textometrie.ens-lyon.fr/?lang=fr).

Ça c'est la théorie, ce que je suis censée faire, mais je ne pourrais pas m'en contenter et ne pas toucher à de nombreuses autres tâches plus ou moins volontaires. J'ai légèrement l'impression que la fiche de poste était taillée trop large exprès pour que je puisse la porter à mon goût.

## Ce que je fais

### Maintenance

Alors, déjà, je suis arrivée à la fin du projet ANR, donc en vrai le logiciel existait déjà. Presque. Plus ou moins : ) Les grandes lignes étaient là, versionnées (ouf !) mais une réécriture quasi-totale de dernière minute a un peu bouleversé les cartes. J'ai donc repris un logiciel essentiellement fonctionnel, avec des notes parfois surprenantes en commentaires («ça ça marche pas, je vois pas trop bien pourquoi, alors en attendant je fais ça, c'est moche mais ça contourne le problème»), que j'ai dû faire doucement évoluer depuis ma prise de fonction.

Surtout que, au quotidien, mon chercheur vient souvent me voir avec des problèmes incroyables qui surgissent de nulle part : «Alice, l'annotation de tel mot, là, ça marche plus du tout !! Comment ça se fait ?» C'est le moment où je pars angoissée dans des recherches frénétiques sur l'évolution du projet sur les quelques derniers mois, pour me rendre compte en général que soit le truc en question n'a jamais pu marcher, soit que j'ai tout cassé en touchant quelque chose qui n'aurait dû avoir aucun rapport…

### Prise d'initiatives, conception de scripts ad-hoc

Comme je l'ai dit, le projet était déjà écrit et versionné, mais la situation n'était pas rose pour autant. Le code était sur un dépôt public pas du tout lié au labo, sur le compte personnel de mon prédécesseur. Pas top. J'ai d'abord rêvé que le code du labo pourrait être au labo, avec la documentation nécessaire, bref, avoir un semblant de S.I. comme ceux des boîtes que j'avais pu fréquenter. C'est une pure utopie, apparemment, dans le public. Je n'ai accès officiellement à aucune ressource directe (machine physique, virtuelle, même un conteneur quelque part), ce qui fut pour moi une grande source de frustration. Les gens veulent «des sites ouèbe», le SI de l'organisme dont dépend le labo veut fournir «des services», pas «des machines que tout le monde oublie au bout de 6 mois et qui laissent des failles de sécurité». J'ai testé, quand on demande le service «SSH avec des droits root», la réponse est non : \

Alors j'ai dû me débrouiller plus ou moins, récupérer un accès à une VM généreusement prêtée par un collègue, laisser des choses sur ce dépôt public, mais en créant au moins une organisation pour le projet correspondant de telle sorte que tout ne soit pas rattaché seulement au compte que j'ai dû y créer. Je mets tout ce qui n'a pas besoin d'être diffusé hors du labo sur cette VM complètement inaccessible de l'extérieur.

Finalement ça fait quand même quelques projets : convertir les textes au bon format pour entrer dans la chaîne de traitement, faire des vérifications rapides sur le bon état des fichiers à une étape clef du traitement (et corriger quand on se rend compte que tous les fichiers d'une source ne sont même pas des fichiers XML valides…), mettre à jour les métadonnées d'un corpus demande pas mal de petit outillage. J'ai démarré plein de tout petits projets de code pour mes propres besoins, et fixer au passage une manière de faire, documenter l'outil et la procédure qui l'emploie.

Et puis, comme je l'ai dit, j'ai rejoint ce labo sur un projet précis mais nous en avons entamé d'autres, déposé des demandes de financement pour encore les suivants. J'ai participé à la réflexion sur la conception des nouvelles chaînes de traitement à utiliser inspirées de notre existant mais en l'adaptant aux exigences des nouveaux projets de recherche. Ce fut l'occasion de réunions très intéressantes à la [BnF](https://www.bnf.fr/fr) avec des gens du monde de la numérisation de documents, des gens travaillant sur des algorithmes de reconnaissance de structures des documents, des spécialistes de certaines œuvres historiques précises… Le monde du livre n'est jamais loin : )

### Un peu de linguistique

À la base, ce qui m'a amenée à travailler dans ce labo, c'était le désir de me rapprocher des linguistes «pure laine» pour ne pas aborder le Traitement Automatique des Langues qu'avec l'approche des informaticiens qui essayent de le réduire à de la logique ou des probabilités (suivant les deux principaux courants) pour ramener la langue naturelle à des langages de programmation.

De proche en proche, je finis par acquérir des termes, des façons de s'intéresser au texte qui relèvent de la linguistique. J'ai pu faire connaissance de gens passionnants, aller suivre les cours de certains. Je ne m'étais jamais posé beaucoup de questions jusqu'à ce jour sur les «expressions figées», sur la distribution de fréquence des prépositions ou sur l'alphabet phonétique international.

### Formation, diffusion

Je crois que c'est la partie que je préfère : ) Comme je l'ai dit, il n'y a à peu près rien pour faire les choses «bien» sur le plan informatique. En même temps, il s'agit d'un labo de sciences humaines, ce n'est pas le métier de la plupart des gens qui travaillent ici. J'ai donc essayé au passage d'expliquer de quelle manière les gens pouvaient mettre à profit les outils que j'utilisais comme `git` ou le langage `Markdown` par exemple. J'essaye aussi de montrer des alternatives libres aux services en lignes truffés de maliciels qui sont souvent malheureusement les seuls connus par des chercheur·ses peu sensibilisé·es à ces problématiques.

Certains collègues essayent de se débrouiller avec leurs fichiers mais n'hésitent pas à me poser des questions de temps en temps, donc j'ai dû prendre du temps pour expliquer l'encodage, les formats de fichiers, des choses simples mais dont j'aime bien parler. Bon, c'est aussi moi qui fais la Cassandre de service quand on vient me voir avec des fichiers qui «ont l'air corrompus, on n'arrive pas à les importer dans [insérer ici le nom d'un logiciel de traitement audio/vidéo]» et que je dois expliquer qu'une inspection rapide révèle que le fichier a été entièrement nullifié (il n'est pas vide, il a une taille normale pour un fichier de ce type, mais chacun de ses octets est l'octet nul, il ne contient plus aucune autre information que sa taille).

Et alors le truc que j'ai adoré par-dessus tout à la fin de l'année scolaire dernière, c'est qu'une stagiaire de M2 est venue travailler sur notre projet. Elle a eu à toucher un peu à des données utilisées directement par la chaîne de traitement donc j'ai dû la former à son utilisation, lui montrer comment versionner les changements qu'elle allait faire (si je recherche un jour du boulot dans le privé, je crois que je mettrai «évangéliste `git`» sur mon CV…). C'était absolument génial, elle a été très curieuse, m'a posé plein de question et j'ai vraiment eu l'impression de la voir passer par les étapes d'émerveillement par lesquelles je suis passée quand j'ai découvert l'informatique. Oui, ça inclue le stade kitchounet quand, à peu près deux mois après le début de son stage, je l'ai retrouvée avec un terminal vert fluo sur fond noir… ^^'

### Vie sociale du labo

Enfin, un labo c'est un endroit absolument merveilleux avec plein de gens qui montent des projets incroyables et qui ont besoin de soutien. Je ne sais pas vraiment dans quelle mesure c'est mon travail (en tout cas je suis à peu près sûre de ne pas être payée pour ça), mais il me paraît essentiel d'aller d'aider comme je peux.

J'ai participé en tant que staff à l'organisation de conférences, j'ai aidé à mettre en place les amphis, à charier le matériel, à préparer les sacs de bienvenue et à accueillir les participant·es. Là, j'ai encore vraiment l'impression de travailler, mais c'est vrai que quand il s'agit de participer comme cobaye à une expérience de socio en mode «jeu de rôle» avec des acteurs voire de tester un jeu vidéo réalisé par une équipe plutôt portée sur les sciences cognitives, je suis plus tout à fait certaine d'être au boulot : )


[^startup]: qu'est-ce que je peux plus piffrer ce mot comme tant qui ont complètement perdu leur sens initial — déjà à la base le concept est pas le plus renversant du monde mais vu comme on l'emploie à tort et à travers c'est juste devenu une posture

[^autre_article]: vous n'êtes pas encore allé·e lire l'autre article dont je parle ? râh mais à quoi ça sert que je truffe mes articles de liens moi ? c'est tout expliqué dedans les lemmes et les POS et tout