Clonage dans un plasmide (pUC) • Site multiple de clonage au ...

160 downloads 520 Views 2MB Size Report
Site multiple de clonage au niveau d'une portion du gène de la β-galacto- sidase E. coli (LacZ'). • Sélection des bactéries transformées. (plasmide avec ou sans ...
Clonage dans un plasmide (pUC) • Réplication indépendante de celle du chromosome bactérien (ori) • Sélection des bactéries transformées (plasmide avec ou sans insert): ampR • Site multiple de clonage au niveau d'une portion du gène de la β-galactosidase E. coli (LacZ'). • Sélection des bactéries transformées (plasmide avec insert): crible blanc/bleu en présence d'IPTG et de X-gal. • Capacité de clonage: 3 - 4 kb

Cycles du bactériophage λ (phage tempéré) Cycle lytique

Cycle lysogénique

Injection de l'ADN du phage dans la bactérie Réplication de l'ADN Synthèse des protéines de la capside Assemblage des particules phagiques Lyse bactérienne

Intégration de l'ADN du phage dans le chromosome bactérien (prophage) Réplication en même temps que le chromosome bactérien Induction

Stimulus externe

Excision du prophage

Génome du phage λ Génome λ: ADN bicaténaire de 48,5 kb Gènes essentiels au déroulement du cycle lysogénique → 25% du génome cosR

cosL Gènes essentiels au déroulement du cycle lytique (synthèse ADN, assemblage des particules phagiques, lyse) → 60% du génome

Structures du génome • Molécule linéaire dans les particules phagiques • Circularisation au niveau des extrémités cos (segments d'ADN simple brin complémentaires) dans les bactéries infectées par le phage

Construction du vecteur de clonage BamH1 cosR

cosL

λ de type sauvage Délétion des gènes non essentiels au déroulement du cycle lytique

Gène de sélection (ex: lacZ) cosL Fragment de substitution

Vecteur de clonage λ (≅45 kb) cosR Insertion d'un fragment de substitution (≅ 15 kb)

cosR

cosL ADN exogène

Délétion du fragment de substitution Insertion de l'ADN exogène

Contrainte liée à l'assemblage de particules phagiques infectieuses La taille de la molécule d'ADN doit être comprise entre 38 et 51 kb Clonage de fragments d'ADN exogène de tailles comprises entre 9 et 22 kb

(T4 DNA ligase)

cosR

cosR

Procédure de clonage dans le phage λ

Clonage dans un cosmide Gène de résistance à la tétracycline (tet R) 4-6 kb Sélection des bactéries contenant un cosmide recombinant

Sites cos Site de clonage (Bgl II)

Origine de réplication (ori)

Cosmide: site cos du phage λ + plasmide → Clonage de fragment de 45 kb maximum (capacité λ ×3) Sites cos λ → Encapsidation in vitro → Particules virales capables d'infecter E. coli (efficacité > transformation) Origine de réplication plasmidique → Multiplication dans la bactérie de la même façon qu'un plasmide

Procédure de clonage dans un cosmide

Dephosphorylate (alkaline phosphatase) (T4 DNA ligase)

Individualisation et stockage des clones recombinants

Vecteurs PAC (P1-derived artificial chromosome) LoxP

Bactériophage P1

Phage tempéré; hôte E. coli Taille du génome: 115 kb

Capacité de clonage des vecteurs PAC : 75-95 kb Structure du vecteur ori: origine de réplication plasmidique kanR: gène de résistance à la kanamicyne

P1 plasmid replicon

ScaI pBR322 ori pac

pAD 10sacBII (30 kb)

LoxP sacB

Kan R P1 lytic replicon

BamHI Pac ("packaging site"): le clivage de ce site permet l'assemblage des particules virales

LoxP: sites de recombinaison du phage P1 "P1 plasmid replicon": réplication et maintient d'une seule copie par bactérie "P1 lytic replicon": gènes sous le contrôle du promoteur lac. Induction de par l'IPTG → l'amplification du nombre de copies du vecteur recombinant sacB: gène de saccharose synthase; crible de sélection des bactéries recombinantes; site de clonage (BamH1). La dégradation du saccharose produit un composé hautement toxique pour les bactéries. Sur un milieu contenant du saccharose, seules les bactéries dont le gène sacB est modifié se développeront.

Empaquetage in vitro

Digestion du vecteur BamHI + ScaI

1. Digestion partielle d'ADN exogène de haut poids moléculaire 2. Sélection des fragments de 70-95 kb

Individualisation et stockage des clones

Sélection des colonies contenant un PAC recombinant

Milieu sélectif saccharose + kanamycine

Ligature → concaténaires Clivage des sites pac (pacase)

Circularisation

P1 plasmid P1 lytic replicon replicon

Infection E. coli (cre+)

Recombinase Gène cre

Vecteurs BAC (Bacterial artificial chromosome)

lacZ'

Taille maximale des inserts 300-350 kb, le plus souvent 100-150 kb

Facteur F (fertilité) E. coli → plasmide impliqué dans la conjugaison bactérienne. → Intégration au chromosome bactérien réversible → Excision du chromosome en même temps qu'une portion du génome bactérien (× 10100 kb → 4,6 Mb) Structure des vecteurs BAC oriS: origine de réplication repE: réplication du plasmide à partie de oriS; maintient du nombre de copies à 1-2 par cellule parA, parB: stabilité du plasmide; incompatibilité avec d'autres facteurs F (parB) CMR: gène de résistance au chloramphénicol Site de clonage dans le gène lacZ': crible de sélection blanc/bleu

lacZ'

7 kb

1. Digestion du vecteur (HindIII) 2. Déphosphorylation (phophatase alcaline)

Ligature

T4 DNA ligase

CMR

1. ADN de haut poids moléculaire partiellement digéré (HindIII) 2. Sélection des fragments de taille > 150 kb (Electrophorèse en champ pulsé) Transformation E. coli par électroporation 1 colonie bactérienne renfermant 1 BAC recombinant

Stockage des clones (plaques de microtitration)

Étalement des bactéries sur un milieu contenant du chloramphénicol, de l'IPTG et de l'X-gal Sélection des colonies blanches

Vecteurs YAC (Yeast artificial chromosome) Cellules hôtes Vecteur sans insert, circulaire → E. coli → ori; agent de sélection: AmpR Vecteur avec insert, YAC → S. cerevisiae → ARS, CEN, TEL Structure du vecteur ARS: origine de réplication levure CEN4: centromère du chromosome IV TEL: Télomères du chromosome I

SUP4

EcoRI

CEN ARS TRP1 pYAC4 (11,4 kb)

AmpR

URA3

ori TEL

TEL

BamHI

TRP1 et URA3 : gène impliqué dans la synthèse du tryptophane (TRP1) et de l'uracile (URA3); souche de levure mutée pour ces gènes SUP4: site de clonage; suppression d'une mutation qui confère une couleur blanche aux colonies de levure Taille des inserts: 300-500 kb

Clonage dans un vecteur YAC

1. Digestion partielle d'ADN de haut poids moléculaire (EcoRI)

1. Digestion du vecteur par BamHI + EcoR1 2. Déphosphorylation (phosphatase alcaline) TEL

CEN TRP1

URA3 TEL SUP4

Ligature TEL

2. Sélection de fragments > 200-300 kb (Electrophorèse en champ pulsé)

T4 DNA ligase

CEN

URA3 TEL

TRP1

Transformation S. cerevisiae (sphéroplastes; souche AB1380)

Culture sur milieu sélectif

Sélection des colonies recombinantes 1. Couleur rouge: présence d'un insert dans le YAC (disruption du gène SUP4) 2. Croissance en absence d'uracile et de tryptophane: présence des 2 bras du vecteur

Individualisation et stockage des clones

Organisme

Taille du génome Mbp/1C

Cosmide (40 kbp)

BAC (150 kbp)

YAC (500 kbp)

4.6

530

140

40

Levure

12

1380

370

110

Nématode

100

1. 15 × 104

3070

920

125

1. 45 × 104

3840

1150

Nom commun (famille)

Escherichia coli Saccharomyces cerevisiae Caenorhadditis elegans Arabidopsis thaliana Drosophila melanogaster

Drosophile

165

1. 90 × 104

5060

1520

Lycopersicon esculentum

Tomate

950

1. 09 × 105

2.92 × 104

8750

Maïs

2640

3. 04 × 105

8.10 × 104

2.43 × 104

Homme

3000

3. 45 × 105

9.21 × 104

2.76 × 104

Hordeum vulgare

Orge

4880

5. 62 × 105

1.50 × 105

4.50 × 104

Triticum aestivum

Blé

16 000

1. 84 × 106

4. 91 × 105

1.47 × 105

(Liliacée)

100 000

1. 15 × 107

3. 07 × 106

9.21 × 105

Zea mays Homo sapiens

Fritillaria assyriaca

Nombre de clones (N) nécessaires pour avoir 99% de chances d'identifier une séquence particulière dans une banque de cosmide, de BAC ou de YAC, en fonction de l'espèce.

Principe de la méthode de Sanger Blocage de l'incorporation de nouveaux dNTP

Brin d'ADN en cours d'élongation O #

%$! P O O

H

O

H

O

Incorporation dans le brin en cours d'élongation par une ADN polymérase

H

H

ADN polymérase O

O P O P ! P O O

H

&$

!"

Liaison phosphodiester O

Base

CH2 O

O Base

CH2 O

O H

H

H

!"

H

Déoxyribonucléotide triphosphate (dNTP)

O

O P O P O P O O

H

O

O

Base

CH2 O

O H

H

H

"

H

H

Didéoxyribonucléotide triphosphate (ddNTP) Analogue structuraux des dNTP

Réaction de séquence Mélange réactionnel • ADN matrice (double brin) • Amorce • dATP, dGTP, dTTP, dCTP • ddATP, ddGTP, ddTTP, ddCTP • ADN polymerase thermostable

Incubation → Thermocycleur • Dénaturation (92-95°C) • Hybridation des amorces (55-60°C) • Elongation (70-72°C) P P

dNPT P

ddNPT P

P PP

5'

P

P

P

!" 3'

!"

P

"

Amorce

3'

A

P

T

G

C

C

G

A

C

G

G

C

P

P

P

Brin matrice

P

T

P

A

P

C

P

P 5'

Amorce marquée

GACCTAGAGTATCC CTGGATCTCATAGG

(système LI-COR)

ADN matrice + dNTP + Amorce marquée (fluorochrome ddATP

ddCTP

GddA GACCTddA GACCTAGddA GACCTAGAGTddA

-

Faisceau laser

+

A

C

G

T

) + ADN polymérase

ddGTP

GAddC GACddC GACCTAGAGTATddC GACCTAGAGTATCddC

C C T A T G A G A T C C A G

Brin matrice

ddTTP

ddG

GACCTAddG GACCTAGAddG

GACCddT GACCTAGAGddT GACCTAGAGTAddT

Stockage de l'information Détermination de la séquence Numérisation de l'image Enregistrement des signaux

Marquage terminal (ddNTP marqués) (système Applied Biosystems)

ADN matrice + dNTP + ddNTP marqués + Amorce + ADN polymérase

Analyse de la séquence Stockage de l'information

GACCTAGAGTATCC CTGGATCTCATAGG

ddATP ddCTP ddGTP ddTTP GACCTAGAGTATC GACCTAGAGTA GACCTAGAG GACC GA G GAC GACCT GACCTA GACCTAGAGT GACCTAG GACCTAGA GACCTAGAGTAT

Préparation de l'ADN matrice pour le séquençage Plasmide ADN bactérien

Insert

Lyse des bactéries Amplification par PCR

Préparation d'ADN plasmidique

Séquençage

Séquençage à partir d'une matrice ADN double brin Hybridation de l'amorce avec le brin -

Hybridation de l'amorce avec le brin +

Synthèse du brin -

synthèse du brin +

Brin -

Séquence du brin +

Brin +

Séquence du brin -

Exemple: longueur maximale déterminée par le séquenceur = 1 kbp Taille de l'insert: 1,5 kbp Brin +

Brin -

Zone de chevauchement Séquence complète

Taille de l'insert: 3 kbp

Brin +

Brin -

Séquence partielle

RFLP (Restriction Fragment Lenght Polymorphism) Paire de chromosomes homologues

Mutation ponctuelle disparition du site !

Sites de restriction de l'enzyme " #

!

$

Lignée A

Lignée B

Digestion de l'ADN par l'enzyme de restriction Miration sur gel d'agarose Transfert sur une menbrane de nylon (Southern blot) Hybridation de la sonde

-

Lignée A Lignée B

Sonde marquée radioactivement

F1

Ségrégation 1:2:1 parmi les descendants F2

+ Profil d'hybridation

Microsatellites (SSR pour Simple Sequence repeat) Paire de chromosomes homologues 11 répétitions du motif microsatellite

16 répétitions du motif microsatellite

Lignée A

Lignée B Sites d'hybridation des amorces PCR

Miration sur gel de séquence (Séquenceur automatique) Visualisation du polymorphisme

-

+

Lignée A Lignée B

Amplification du locus par PCR → Amorces marquées → Incorporation de dNTP marqués

F1

Ségrégation 1:2:1 parmi les descendants F2

Détection du polymorphisme de séquences par SSCP (Single Strand Conformation Polymorphism) Amplification PCR à partir d’amorces spécifiques de locus (introns, ADN non codant) Polymorphisme de taille ou de restriction rare Polymorphisme de séquence fréquent Homozygote AA

Hétérozygote AB

Homozygote BB

Dénaturation: chaleur, formamide

Migration sur gel de polyacrylamide en conditions non dénaturantes Révélation après coloration au nitrate d’argent

Cartes génétiques d'Arabidopsis thaliana (Alonso-Blanco et al., 1998)

A

B

A

A: Ler × Col B: Ler × Cvi A

B

A

B A

B

B

Densité moyenne: 1 marqueur/cM Relation entre cartes génétiques et physiques: génome complet: 1 cM = 280 kb Chr. 1: 1 cM = 240 kb Chr. 2: 1 cM = 280 kb Chr. 3: 1 cM = 310 kb

Chr. 4: 1 cM = 215 kb Chr. 5: 1 cM = 250 kb

Relation entre distance physique et distance génétique Espèce

Longueur du génome

Distance de carte (cM)

Longueur ADN

(Mbp)

Génome

Chromosome

(kbp)/cM

Phage T4 *

0.16

800

-

0.2

E. Coli *

4.6

1750

-

2.6

Levure *

12

4200

260

2.8

Nématode *

100

320

A. Thaliana *

125

480-630

100-130

200-260

Drosophile *

165

280

70

600

Riz *

430

1575

130

270

haricot

650

830

75

780

Tomate

950

1270

105

750

Colza

1200

1020

55

1180

Soja

1200

2700

135

440

Maïs

2500

1860

190

1340

Souris *

3000

1700

100

1760

Homme *

3300

2800(H)–4780(F)

120(H)-210(F)

690(H)-1180(F)

Blé

16 000

3500

170

4570

Pin maritime

24 000

1800

150

13 000

310

Construction de cartes physiques Regrouper et ordonner un ensemble de fragments d'ADN chevauchants provenant d'une (ou plusieurs) banques génomiques Retrouver l'ordre linéaire des fragments d'ADN tels qu'il existe sur le chromosome dont ces fragments sont issus (assignation chromosomique)

1 contig

Insert de grande taille cloné dans un YAC ou un BAC

Contig de clones → ordonnancement de segments continus d'ADN se chevauchant partiellement Carte physique saturée lorsque le nombre de contigs est identique au nombre de chromosomes et que l'ensemble des contigs couvre totalement le génome

Etablissement de contigs à partir de cartes de restriction des inserts (Restriction Fragment Fingerprinting) % Numérisation des images Migration des profils de restriction sur gel d'agarose Digestion totale de l'ADN par un enzyme de restriction (6 bp) Isolement de l'ADN des BAC

Digestion HindIII Ligne de dépôt

Marra et al., 1999. A map for séquence analysis of Arabidopsis thaliana genome

kb M

23.1 12.2

5.1

2.0

0.4

Colonies bactériennes contenant des BAC recombinants

Etablissement de contigs à partir de cartes de restriction des inserts (Restriction Fragment Fingerprinting) & Images numérisées

Assignation chromosomique

Détermination de la taille des produits de digestion de chacun des inserts

Alignement correct

Alignement incorrect

Carte de restriction des inserts et assemblage des contigs

Utilisation des données de cartographie génétique ( marqueurs RFLP et microsatellites) pour la construction de cartes physiques Position des marqueurs moléculaires sur le groupe de liaison

%

&

)+*

'

(

++, '

)

*

+

Sondes RFLP

,

Assignation chromosomique

Hybridation de chacune des sondes avec l'ADN des clones

%+&

*++

, +

(+)

* &

Dépôt de l'ADN des clones de la banque sur une série de menbrane de nylon

' %

(

)

& Assemblage des contigs

Chromosome 4

Chromosome 5

Cartes physiques et génétiques des chromosomes 4 et 5 d'Arabidopsis thaliana Source: http://nasc.nott.ac.uk/JIC-contig/

Utilisation des remaniements chromosomiques pour assigner des locus marqueurs à un chromosome Remaniement chromosomique: modification visible de la séquence linéaire des gènes portés par un chromosome → délétion, insertion, duplication, inversion, translocation de fragments chromosomiques Etudes de descendances: parent à caryotype normal × parent à caryotype réarrangé Chromosome 9 normal

Chromosome 9 réarrangé

Chromosomes recombinants

Assignation chromosomique chez le maïs (Creighton et McClintock, 1931)

Hybridation d'une sonde de βtubuline sur des chromosomes polytènes de drosophile

Hybridation simultanée de 6 sondes spécifiques de chromosomes humains révélées par des fluorochromes différents.

Hybridation d'un mélange de sondes correspondant à un contig de BAC localisé à une des extrémité du chromosome 2 d'Arabidopsis thalialiana Arabidopsis thalialiana → signal unique Brassica rapa → signaux détectés sur 6 paires de chromosomes

Hybridation simultanée de 6 sondes couvrant un contig de clones BAC de 431 kbp

Mycoplasmes et Bactéries O.5 - 6 Mbp

Levure: 12 Mbp → 0.75 Mbp/chr. A. thaliana: 125 M bp → 25 Mbp/chr. Homme: 3000 Mbp → 130 Mbp/chr.

Comment déterminer la séquence des ces génome ? Banques génomiques Techniques de Cartes séquençage physiques Cartes génétiques

O utils

Définition de stratégies

Etablir le lien entre la séquence des clones et leur position physique sur le génome Déterminer l'ordre des clones les uns par rapport aux autre (YAC, BAC, PAC) Déterminer la séquence des clones (Cosmides, plasmides)

Cartes génétiques Marqueurs cytologiques Hybridation in situ Hybrides somatiques

Cartes physiques

"

# Séquençage

"

Statégie dirigée → carte physique → sous clonage et séquence d'un minimum de clones redondants

#

Statégie directe ou aléatoire (whole genome shotgun sequencing) → banques de plasmides et de cosmides → séquences aléatoire des clones → carte physique

!

Stratégie intermédiaire (hierarchical shotgun sequencing) → carte physique → sous clonage → séquences aléatoire des clones

Suggest Documents