Site multiple de clonage au niveau d'une portion du gène de la β-galacto- sidase
E. coli (LacZ'). • Sélection des bactéries transformées. (plasmide avec ou sans ...
Clonage dans un plasmide (pUC) • Réplication indépendante de celle du chromosome bactérien (ori) • Sélection des bactéries transformées (plasmide avec ou sans insert): ampR • Site multiple de clonage au niveau d'une portion du gène de la β-galactosidase E. coli (LacZ'). • Sélection des bactéries transformées (plasmide avec insert): crible blanc/bleu en présence d'IPTG et de X-gal. • Capacité de clonage: 3 - 4 kb
Cycles du bactériophage λ (phage tempéré) Cycle lytique
Cycle lysogénique
Injection de l'ADN du phage dans la bactérie Réplication de l'ADN Synthèse des protéines de la capside Assemblage des particules phagiques Lyse bactérienne
Intégration de l'ADN du phage dans le chromosome bactérien (prophage) Réplication en même temps que le chromosome bactérien Induction
Stimulus externe
Excision du prophage
Génome du phage λ Génome λ: ADN bicaténaire de 48,5 kb Gènes essentiels au déroulement du cycle lysogénique → 25% du génome cosR
cosL Gènes essentiels au déroulement du cycle lytique (synthèse ADN, assemblage des particules phagiques, lyse) → 60% du génome
Structures du génome • Molécule linéaire dans les particules phagiques • Circularisation au niveau des extrémités cos (segments d'ADN simple brin complémentaires) dans les bactéries infectées par le phage
Construction du vecteur de clonage BamH1 cosR
cosL
λ de type sauvage Délétion des gènes non essentiels au déroulement du cycle lytique
Gène de sélection (ex: lacZ) cosL Fragment de substitution
Vecteur de clonage λ (≅45 kb) cosR Insertion d'un fragment de substitution (≅ 15 kb)
cosR
cosL ADN exogène
Délétion du fragment de substitution Insertion de l'ADN exogène
Contrainte liée à l'assemblage de particules phagiques infectieuses La taille de la molécule d'ADN doit être comprise entre 38 et 51 kb Clonage de fragments d'ADN exogène de tailles comprises entre 9 et 22 kb
(T4 DNA ligase)
cosR
cosR
Procédure de clonage dans le phage λ
Clonage dans un cosmide Gène de résistance à la tétracycline (tet R) 4-6 kb Sélection des bactéries contenant un cosmide recombinant
Sites cos Site de clonage (Bgl II)
Origine de réplication (ori)
Cosmide: site cos du phage λ + plasmide → Clonage de fragment de 45 kb maximum (capacité λ ×3) Sites cos λ → Encapsidation in vitro → Particules virales capables d'infecter E. coli (efficacité > transformation) Origine de réplication plasmidique → Multiplication dans la bactérie de la même façon qu'un plasmide
Procédure de clonage dans un cosmide
Dephosphorylate (alkaline phosphatase) (T4 DNA ligase)
Individualisation et stockage des clones recombinants
Vecteurs PAC (P1-derived artificial chromosome) LoxP
Bactériophage P1
Phage tempéré; hôte E. coli Taille du génome: 115 kb
Capacité de clonage des vecteurs PAC : 75-95 kb Structure du vecteur ori: origine de réplication plasmidique kanR: gène de résistance à la kanamicyne
P1 plasmid replicon
ScaI pBR322 ori pac
pAD 10sacBII (30 kb)
LoxP sacB
Kan R P1 lytic replicon
BamHI Pac ("packaging site"): le clivage de ce site permet l'assemblage des particules virales
LoxP: sites de recombinaison du phage P1 "P1 plasmid replicon": réplication et maintient d'une seule copie par bactérie "P1 lytic replicon": gènes sous le contrôle du promoteur lac. Induction de par l'IPTG → l'amplification du nombre de copies du vecteur recombinant sacB: gène de saccharose synthase; crible de sélection des bactéries recombinantes; site de clonage (BamH1). La dégradation du saccharose produit un composé hautement toxique pour les bactéries. Sur un milieu contenant du saccharose, seules les bactéries dont le gène sacB est modifié se développeront.
Empaquetage in vitro
Digestion du vecteur BamHI + ScaI
1. Digestion partielle d'ADN exogène de haut poids moléculaire 2. Sélection des fragments de 70-95 kb
Individualisation et stockage des clones
Sélection des colonies contenant un PAC recombinant
Milieu sélectif saccharose + kanamycine
Ligature → concaténaires Clivage des sites pac (pacase)
Circularisation
P1 plasmid P1 lytic replicon replicon
Infection E. coli (cre+)
Recombinase Gène cre
Vecteurs BAC (Bacterial artificial chromosome)
lacZ'
Taille maximale des inserts 300-350 kb, le plus souvent 100-150 kb
Facteur F (fertilité) E. coli → plasmide impliqué dans la conjugaison bactérienne. → Intégration au chromosome bactérien réversible → Excision du chromosome en même temps qu'une portion du génome bactérien (× 10100 kb → 4,6 Mb) Structure des vecteurs BAC oriS: origine de réplication repE: réplication du plasmide à partie de oriS; maintient du nombre de copies à 1-2 par cellule parA, parB: stabilité du plasmide; incompatibilité avec d'autres facteurs F (parB) CMR: gène de résistance au chloramphénicol Site de clonage dans le gène lacZ': crible de sélection blanc/bleu
lacZ'
7 kb
1. Digestion du vecteur (HindIII) 2. Déphosphorylation (phophatase alcaline)
Ligature
T4 DNA ligase
CMR
1. ADN de haut poids moléculaire partiellement digéré (HindIII) 2. Sélection des fragments de taille > 150 kb (Electrophorèse en champ pulsé) Transformation E. coli par électroporation 1 colonie bactérienne renfermant 1 BAC recombinant
Stockage des clones (plaques de microtitration)
Étalement des bactéries sur un milieu contenant du chloramphénicol, de l'IPTG et de l'X-gal Sélection des colonies blanches
Vecteurs YAC (Yeast artificial chromosome) Cellules hôtes Vecteur sans insert, circulaire → E. coli → ori; agent de sélection: AmpR Vecteur avec insert, YAC → S. cerevisiae → ARS, CEN, TEL Structure du vecteur ARS: origine de réplication levure CEN4: centromère du chromosome IV TEL: Télomères du chromosome I
SUP4
EcoRI
CEN ARS TRP1 pYAC4 (11,4 kb)
AmpR
URA3
ori TEL
TEL
BamHI
TRP1 et URA3 : gène impliqué dans la synthèse du tryptophane (TRP1) et de l'uracile (URA3); souche de levure mutée pour ces gènes SUP4: site de clonage; suppression d'une mutation qui confère une couleur blanche aux colonies de levure Taille des inserts: 300-500 kb
Clonage dans un vecteur YAC
1. Digestion partielle d'ADN de haut poids moléculaire (EcoRI)
1. Digestion du vecteur par BamHI + EcoR1 2. Déphosphorylation (phosphatase alcaline) TEL
CEN TRP1
URA3 TEL SUP4
Ligature TEL
2. Sélection de fragments > 200-300 kb (Electrophorèse en champ pulsé)
T4 DNA ligase
CEN
URA3 TEL
TRP1
Transformation S. cerevisiae (sphéroplastes; souche AB1380)
Culture sur milieu sélectif
Sélection des colonies recombinantes 1. Couleur rouge: présence d'un insert dans le YAC (disruption du gène SUP4) 2. Croissance en absence d'uracile et de tryptophane: présence des 2 bras du vecteur
Individualisation et stockage des clones
Organisme
Taille du génome Mbp/1C
Cosmide (40 kbp)
BAC (150 kbp)
YAC (500 kbp)
4.6
530
140
40
Levure
12
1380
370
110
Nématode
100
1. 15 × 104
3070
920
125
1. 45 × 104
3840
1150
Nom commun (famille)
Escherichia coli Saccharomyces cerevisiae Caenorhadditis elegans Arabidopsis thaliana Drosophila melanogaster
Drosophile
165
1. 90 × 104
5060
1520
Lycopersicon esculentum
Tomate
950
1. 09 × 105
2.92 × 104
8750
Maïs
2640
3. 04 × 105
8.10 × 104
2.43 × 104
Homme
3000
3. 45 × 105
9.21 × 104
2.76 × 104
Hordeum vulgare
Orge
4880
5. 62 × 105
1.50 × 105
4.50 × 104
Triticum aestivum
Blé
16 000
1. 84 × 106
4. 91 × 105
1.47 × 105
(Liliacée)
100 000
1. 15 × 107
3. 07 × 106
9.21 × 105
Zea mays Homo sapiens
Fritillaria assyriaca
Nombre de clones (N) nécessaires pour avoir 99% de chances d'identifier une séquence particulière dans une banque de cosmide, de BAC ou de YAC, en fonction de l'espèce.
Principe de la méthode de Sanger Blocage de l'incorporation de nouveaux dNTP
Brin d'ADN en cours d'élongation O #
%$! P O O
H
O
H
O
Incorporation dans le brin en cours d'élongation par une ADN polymérase
H
H
ADN polymérase O
O P O P ! P O O
H
&$
!"
Liaison phosphodiester O
Base
CH2 O
O Base
CH2 O
O H
H
H
!"
H
Déoxyribonucléotide triphosphate (dNTP)
O
O P O P O P O O
H
O
O
Base
CH2 O
O H
H
H
"
H
H
Didéoxyribonucléotide triphosphate (ddNTP) Analogue structuraux des dNTP
Réaction de séquence Mélange réactionnel • ADN matrice (double brin) • Amorce • dATP, dGTP, dTTP, dCTP • ddATP, ddGTP, ddTTP, ddCTP • ADN polymerase thermostable
Incubation → Thermocycleur • Dénaturation (92-95°C) • Hybridation des amorces (55-60°C) • Elongation (70-72°C) P P
dNPT P
ddNPT P
P PP
5'
P
P
P
!" 3'
!"
P
"
Amorce
3'
A
P
T
G
C
C
G
A
C
G
G
C
P
P
P
Brin matrice
P
T
P
A
P
C
P
P 5'
Amorce marquée
GACCTAGAGTATCC CTGGATCTCATAGG
(système LI-COR)
ADN matrice + dNTP + Amorce marquée (fluorochrome ddATP
ddCTP
GddA GACCTddA GACCTAGddA GACCTAGAGTddA
-
Faisceau laser
+
A
C
G
T
) + ADN polymérase
ddGTP
GAddC GACddC GACCTAGAGTATddC GACCTAGAGTATCddC
C C T A T G A G A T C C A G
Brin matrice
ddTTP
ddG
GACCTAddG GACCTAGAddG
GACCddT GACCTAGAGddT GACCTAGAGTAddT
Stockage de l'information Détermination de la séquence Numérisation de l'image Enregistrement des signaux
Marquage terminal (ddNTP marqués) (système Applied Biosystems)
ADN matrice + dNTP + ddNTP marqués + Amorce + ADN polymérase
Analyse de la séquence Stockage de l'information
GACCTAGAGTATCC CTGGATCTCATAGG
ddATP ddCTP ddGTP ddTTP GACCTAGAGTATC GACCTAGAGTA GACCTAGAG GACC GA G GAC GACCT GACCTA GACCTAGAGT GACCTAG GACCTAGA GACCTAGAGTAT
Préparation de l'ADN matrice pour le séquençage Plasmide ADN bactérien
Insert
Lyse des bactéries Amplification par PCR
Préparation d'ADN plasmidique
Séquençage
Séquençage à partir d'une matrice ADN double brin Hybridation de l'amorce avec le brin -
Hybridation de l'amorce avec le brin +
Synthèse du brin -
synthèse du brin +
Brin -
Séquence du brin +
Brin +
Séquence du brin -
Exemple: longueur maximale déterminée par le séquenceur = 1 kbp Taille de l'insert: 1,5 kbp Brin +
Brin -
Zone de chevauchement Séquence complète
Taille de l'insert: 3 kbp
Brin +
Brin -
Séquence partielle
RFLP (Restriction Fragment Lenght Polymorphism) Paire de chromosomes homologues
Mutation ponctuelle disparition du site !
Sites de restriction de l'enzyme " #
!
$
Lignée A
Lignée B
Digestion de l'ADN par l'enzyme de restriction Miration sur gel d'agarose Transfert sur une menbrane de nylon (Southern blot) Hybridation de la sonde
-
Lignée A Lignée B
Sonde marquée radioactivement
F1
Ségrégation 1:2:1 parmi les descendants F2
+ Profil d'hybridation
Microsatellites (SSR pour Simple Sequence repeat) Paire de chromosomes homologues 11 répétitions du motif microsatellite
16 répétitions du motif microsatellite
Lignée A
Lignée B Sites d'hybridation des amorces PCR
Miration sur gel de séquence (Séquenceur automatique) Visualisation du polymorphisme
-
+
Lignée A Lignée B
Amplification du locus par PCR → Amorces marquées → Incorporation de dNTP marqués
F1
Ségrégation 1:2:1 parmi les descendants F2
Détection du polymorphisme de séquences par SSCP (Single Strand Conformation Polymorphism) Amplification PCR à partir d’amorces spécifiques de locus (introns, ADN non codant) Polymorphisme de taille ou de restriction rare Polymorphisme de séquence fréquent Homozygote AA
Hétérozygote AB
Homozygote BB
Dénaturation: chaleur, formamide
Migration sur gel de polyacrylamide en conditions non dénaturantes Révélation après coloration au nitrate d’argent
Cartes génétiques d'Arabidopsis thaliana (Alonso-Blanco et al., 1998)
A
B
A
A: Ler × Col B: Ler × Cvi A
B
A
B A
B
B
Densité moyenne: 1 marqueur/cM Relation entre cartes génétiques et physiques: génome complet: 1 cM = 280 kb Chr. 1: 1 cM = 240 kb Chr. 2: 1 cM = 280 kb Chr. 3: 1 cM = 310 kb
Chr. 4: 1 cM = 215 kb Chr. 5: 1 cM = 250 kb
Relation entre distance physique et distance génétique Espèce
Longueur du génome
Distance de carte (cM)
Longueur ADN
(Mbp)
Génome
Chromosome
(kbp)/cM
Phage T4 *
0.16
800
-
0.2
E. Coli *
4.6
1750
-
2.6
Levure *
12
4200
260
2.8
Nématode *
100
320
A. Thaliana *
125
480-630
100-130
200-260
Drosophile *
165
280
70
600
Riz *
430
1575
130
270
haricot
650
830
75
780
Tomate
950
1270
105
750
Colza
1200
1020
55
1180
Soja
1200
2700
135
440
Maïs
2500
1860
190
1340
Souris *
3000
1700
100
1760
Homme *
3300
2800(H)–4780(F)
120(H)-210(F)
690(H)-1180(F)
Blé
16 000
3500
170
4570
Pin maritime
24 000
1800
150
13 000
310
Construction de cartes physiques Regrouper et ordonner un ensemble de fragments d'ADN chevauchants provenant d'une (ou plusieurs) banques génomiques Retrouver l'ordre linéaire des fragments d'ADN tels qu'il existe sur le chromosome dont ces fragments sont issus (assignation chromosomique)
1 contig
Insert de grande taille cloné dans un YAC ou un BAC
Contig de clones → ordonnancement de segments continus d'ADN se chevauchant partiellement Carte physique saturée lorsque le nombre de contigs est identique au nombre de chromosomes et que l'ensemble des contigs couvre totalement le génome
Etablissement de contigs à partir de cartes de restriction des inserts (Restriction Fragment Fingerprinting) % Numérisation des images Migration des profils de restriction sur gel d'agarose Digestion totale de l'ADN par un enzyme de restriction (6 bp) Isolement de l'ADN des BAC
Digestion HindIII Ligne de dépôt
Marra et al., 1999. A map for séquence analysis of Arabidopsis thaliana genome
kb M
23.1 12.2
5.1
2.0
0.4
Colonies bactériennes contenant des BAC recombinants
Etablissement de contigs à partir de cartes de restriction des inserts (Restriction Fragment Fingerprinting) & Images numérisées
Assignation chromosomique
Détermination de la taille des produits de digestion de chacun des inserts
Alignement correct
Alignement incorrect
Carte de restriction des inserts et assemblage des contigs
Utilisation des données de cartographie génétique ( marqueurs RFLP et microsatellites) pour la construction de cartes physiques Position des marqueurs moléculaires sur le groupe de liaison
%
&
)+*
'
(
++, '
)
*
+
Sondes RFLP
,
Assignation chromosomique
Hybridation de chacune des sondes avec l'ADN des clones
%+&
*++
, +
(+)
* &
Dépôt de l'ADN des clones de la banque sur une série de menbrane de nylon
' %
(
)
& Assemblage des contigs
Chromosome 4
Chromosome 5
Cartes physiques et génétiques des chromosomes 4 et 5 d'Arabidopsis thaliana Source: http://nasc.nott.ac.uk/JIC-contig/
Utilisation des remaniements chromosomiques pour assigner des locus marqueurs à un chromosome Remaniement chromosomique: modification visible de la séquence linéaire des gènes portés par un chromosome → délétion, insertion, duplication, inversion, translocation de fragments chromosomiques Etudes de descendances: parent à caryotype normal × parent à caryotype réarrangé Chromosome 9 normal
Chromosome 9 réarrangé
Chromosomes recombinants
Assignation chromosomique chez le maïs (Creighton et McClintock, 1931)
Hybridation d'une sonde de βtubuline sur des chromosomes polytènes de drosophile
Hybridation simultanée de 6 sondes spécifiques de chromosomes humains révélées par des fluorochromes différents.
Hybridation d'un mélange de sondes correspondant à un contig de BAC localisé à une des extrémité du chromosome 2 d'Arabidopsis thalialiana Arabidopsis thalialiana → signal unique Brassica rapa → signaux détectés sur 6 paires de chromosomes
Hybridation simultanée de 6 sondes couvrant un contig de clones BAC de 431 kbp
Mycoplasmes et Bactéries O.5 - 6 Mbp
Levure: 12 Mbp → 0.75 Mbp/chr. A. thaliana: 125 M bp → 25 Mbp/chr. Homme: 3000 Mbp → 130 Mbp/chr.
Comment déterminer la séquence des ces génome ? Banques génomiques Techniques de Cartes séquençage physiques Cartes génétiques
O utils
Définition de stratégies
Etablir le lien entre la séquence des clones et leur position physique sur le génome Déterminer l'ordre des clones les uns par rapport aux autre (YAC, BAC, PAC) Déterminer la séquence des clones (Cosmides, plasmides)
Cartes génétiques Marqueurs cytologiques Hybridation in situ Hybrides somatiques
Cartes physiques
"
# Séquençage
"
Statégie dirigée → carte physique → sous clonage et séquence d'un minimum de clones redondants
#
Statégie directe ou aléatoire (whole genome shotgun sequencing) → banques de plasmides et de cosmides → séquences aléatoire des clones → carte physique
!
Stratégie intermédiaire (hierarchical shotgun sequencing) → carte physique → sous clonage → séquences aléatoire des clones