BTS SIO · Veille technologique site en cours de développement

Qu'est-ce que la Bio-informatique ?

La bio-informatique est une discipline scientifique interdisciplinaire qui combine biologie, informatique, mathématiques et physique pour analyser et interpréter les données biologiques complexes issues des sciences du vivant : génomes, biomolécules, interactions entre organismes…

Elle joue un rôle clé dans la génomique, la médecine moléculaire et la recherche biomédicale, en facilitant la compréhension des processus biologiques et en contribuant à des avancées comme la médecine personnalisée.

~3 Mds paires de bases dans l'ADN humain
200+ milliards de séquences dans GenBank
2003 fin du Human Genome Project
AlphaFold IA révolutionne la biologie structurale

💡 Pourquoi la bio-informatique ? — Avec l'explosion des données biologiques (Big Data), la bio-informatique est devenue indispensable pour analyser et donner du sens à ces informations massives.

Caractéristiques & Évolution

La bio-informatique est liée aux progrès du séquençage, des bases de données et de l'intelligence artificielle. Son évolution est jalonnée de dates clés.

🕐Frise chronologique

1982
GenBank
Création d'une base majeure de séquences nucléotidiques.
1990 → 2003
Human Genome Project
Industrialisation du séquençage & montée en puissance de la bio-informatique.
Années 2010
NGS & Big Data
Explosion des données : pipelines, cloud, analyses multi-omics.
2020
AlphaFold2
L'IA révolutionne la prédiction de structures protéiques.
2022 → 2025
Bio-informatique augmentée
IA, intégration multi-omics, médecine de précision & génomique comparative.

📌Domaines d'application

  • Génomique : analyse et annotation des génomes à grande échelle.
  • Protéomique : étude des protéines (fonctions, structures, interactions).
  • Médecine personnalisée : traitements adaptés au profil génétique.
  • Pharmacologie : identification de cibles et conception assistée.
  • Phylogénie : arbres évolutifs, mutations, génomique comparative.

🧠Compétences clés

Biologie moléculaire Python / R / Bash Bases de données Statistiques Machine Learning Travail pluridisciplinaire Pipelines NGS

Domaines d'application

  • Génomique : étude et séquençage de l'ADN/ARN à l'échelle du génome entier.
  • Protéomique : analyse des protéines, de leurs structures 3D et interactions.
  • Médecine personnalisée : traitements ciblés en fonction du profil génétique du patient.
  • Recherche pharmaceutique : conception de médicaments assistée par ordinateur (drug design).
  • Évolution & Phylogénie : étude des relations évolutives entre espèces.
  • Biologie des systèmes : modélisation des réseaux d'interactions biologiques.
  • Agronomie / Biotechnologies : amélioration des espèces et traçabilité génétique.

Outils & Technologies

💻Langages de programmation

Langage
Python
Langage principal : BioPython, Pandas, NumPy, scikit-learn.
Langage
R
Statistiques & bioconducteur : DESeq2, ggplot2, limma.
Langage
Bash / Shell
Automatisation de pipelines d'analyse NGS sur serveur HPC.
Langage
Perl
Scripts de traitement de texte et de formats biologiques.

🗄️Bases de données

Base de données
GenBank / NCBI
Base de séquences nucléotidiques la plus complète au monde.
Base de données
UniProt
Référence mondiale pour les séquences et fonctions protéiques.
Base de données
PDB
Protein Data Bank : structures 3D des macromolécules biologiques.
Base de données
Ensembl
Annotation des génomes de nombreuses espèces vertébrées.

🤖Intelligence Artificielle

IA
AlphaFold 2/3
Prédiction de structures protéiques par deep learning (DeepMind).
IA
ESMFold
Modèle de langage protéique de Meta AI pour la prédiction de structure.
IA
DNABERT
Modèle transformeur appliqué aux séquences génomiques.

🔧Logiciels & outils d'analyse

Outil
BLAST
Alignement & recherche de similarité entre séquences biologiques.
Outil
GATK
Détection de variants génomiques dans les données NGS.
Outil
Galaxy
Plateforme open-source d'analyse bioinformatique en ligne.
Outil
Nextflow / Snakemake
Orchestration de pipelines d'analyse reproductibles et scalables.

Actualités & Innovations

🔬Inventions récentes

2024Mai
AlphaFold 3 — DeepMind
Extension du modèle aux interactions protéines–ADN–ARN–petites molécules. Révolutionne la conception de médicaments et l'étude des interactions moléculaires.
IA · Structure
2024Jan
Séquençage long-read Oxford Nanopore
Les nouvelles puces R10.4.1 permettent une précision > 99,9 % en lecture longue, ouvrant la voie à des assemblages de génomes complets à faible coût.
Séquençage · NGS

🧬Découvertes majeures

2023Nov
Génome « dark matter » décrypté
Des chercheurs ont caractérisé des régions non-codantes du génome humain jusqu'ici incomprises, révélant de nouveaux mécanismes de régulation génique.
Génomique · Épigénétique
2024Mar
Multiomics & Cancer
Intégration de données génomiques, transcriptomiques et protéomiques permettant d'identifier de nouveaux biomarqueurs pour la détection précoce de cancers.
Cancer · Multi-omics

💡Créations & Algorithmes

2024Fév
Evo — Arc Institute
Premier grand modèle de langage entraîné sur 2,7 millions de génomes bactériens et viraux. Capable de générer des séquences d'ADN fonctionnelles de nova.
LLM · Génomique
2023Sep
Pangenome Reference Graph
Nouveau standard de référence génomique humaine basé sur 47 génomes individuels, plus représentatif que la référence linéaire précédente (GRCh38).
Référence · Génomique

Bibliographie

  • NCBI — GenBank : base de données de séquences nucléotidiquesncbi.nlm.nih.gov/genbank
  • National Human Genome Research Institute — Human Genome Projectgenome.gov
  • Jumper J. et al. — Highly accurate protein structure prediction with AlphaFoldNature, 2021
  • UniProt Consortium — UniProt: the Universal Protein Resourceuniprot.org
  • RCSB — Protein Data Bankrcsb.org
  • BLAST — Basic Local Alignment Search ToolNCBI BLAST
  • Oxford Academic — Bioinformatics Journalacademic.oup.com/bioinformatics
  • NHGRI — Genomics and Medicinegenome.gov/health
  • Abramson J. et al. — Accurate structure prediction of biomolecular interactions with AlphaFold 3Nature, 2024
  • Liao W-W. et al. — A draft human pangenome referenceNature, 2023