Vous me copierez cinq cents lignes!

Trente mille bases environ. C’est, selon la page Wikipédia qui lui est consacrée, la longueur de la chaîne moléculaire qui porte le code génétique du virus SARS-CoV-2, agent du Covid-19. Une longueur record dans sa catégorie, nous précise l’article en question.

La traduction du code génétique en texte brut, où chaque nucléotide est représenté par une lettre symbolisant la base qui le caractérise, utilise un alphabet de quatre lettres représentant chacune une de ces bases. Un spécimen choisi au hasard parmi les exemplaires disponibles du génome de notre virus favori dans la base de données GenBank, est répertorié sous le nom de code LC528232. À la fin d’une page globalement illisible par le commun des mortels figure le « texte intégral » du code, comprenant  très exactement 29902 caractères, organisés pour la lisibilité par lignes de soixante séparés par groupes de dix, soit environ cinq cents lignes, dont je ne résiste pas à la tentation de recopier ici la première, à titre d’illustration.

tgcttatgaa aattttaatc tcccaggtaa caaaccaacc aactttcgat ctcttgtaga

A l’heure où j’écris, GenBank fournit les séquences pour deux cent cinquante échantillons du virus. Les experts nous assurent que les petites variations d’un code à l’autre ne changent pas fondamentalement la nature de la bête, et que telle ou telle variante n’est pas plus ou moins contagieuse ou plus ou moins pathogène. On ne peut que les croire sur parole.

Cinq cent lignes! … cela évoquera peut-être quelques souvenirs cuisants dans l’esprit des lecteurs de ma génération, ex-garnements en culotte courte de l’école primaire de leur village, condamnés par leur « maître » pour des motifs plus ou moins discutables à ces terribles copies de lignes qui devaient être rendues, à la plume sergent-major, sans faute ni rature, avant de pouvoir rejoindre la cour de récréation. Mais quel maître d’école, même le plus impitoyable, aurait osé faire copier de telles lignes, torture plus effroyable pour les yeux et l’esprit que pour le poignet? Il aurait été d’ailleurs lui-même bien puni s’il avait voulu vérifier que la duplication du code par l’élève puni ne contenait pas d’erreur.

Heureusement, pourrait-on dire, la structure de l’ADN n’a été découverte qu’en 1953. Nous l’avons échappé belle! Mais pourquoi ne pas remettre au goût du jour ces bonnes vieilles pratiques pédagogiques pour punir tous les covidiots? Un seul génome à copier pour la première infraction, en cas de récidive double peine avec comparaison lettre à lettre des deux variantes, etc ad libitum. Le tout bien sûr sans aide d’aucun outil informatique.

Cinq cents lignes, c’est surtout un chiffre ridicule comparé aux quantités d’information que nous brassons quotidiennement à propos de ce virus. Tentons ici de nous en faire une idée. Si on enregistre en texte brut les cinq cents lignes ci-dessus, on obtient un fichier de quelques pages, qui pèse un peu plus de trente ko, soit un peu plus d’un octet par caractère. Le texte est un format peu gourmand! Chaque photo de nos téléphones se mesure en mégaoctets, soit des milliers de fois plus d’information en théorie que notre virus. Un fichier MP3 pèse plusieurs centaines de ko par seconde d’enregistrement. Sans parler de la vidéo encore plus gourmande.

Quant aux données concernant le Covid-19, vraies ou fausses, utiles ou inutiles, actuelles ou périmées, épidémiologiques, cliniques, biochimiques, sociales, politiques, les analyses et commentaires, les contenus multimédia, stockés sur les serveurs, échangés sur les réseaux sociaux depuis le début de l’épidémie représentent des volumes astronomiques d’information que je me garderais bien de tenter d’évaluer, et en tout cas sans commune mesure avec ces malheureuses cinq cents lignes de code. Une quantité d’information dérisoire qui fait un pied de nez au monde des « Big Data », se duplique et se propage avec une efficacité implacable et la complicité bien involontaire de la machinerie cellulaire de toutes les personnes infectées, qu’elles le sachent ou non.

Quelle chose par là nous peut être enseignée?
J’en vois deux … écrivait La Fontaine dans Le Lion et le Moucheron, fable dont la relecture n’est pas sans intérêt dans les circonstances actuelles. Même si le coin obscur du monde où l’araignée tisse sa toile, qui capturera un jour espérons-le notre bestiole, est loin d’avoir été découvert.

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s