Bio::Align::Graphics: move into its own distribution and drop dependency on GD
[bioperl-live.git] / t / data / PX1CG.gb
blob51ae9942a1daa5f2763819b03369c1eb36854d9a
1 LOCUS       PX1CG                   5386 bp ss-DNA     circular PHG 16-JUN-2004
2 DEFINITION  Coliphage phi-X174, complete genome.
3 ACCESSION   J02482 M10348 M10379 M10714 M10749 M10750 M10866 M10867 M24859
4             V01128
5 VERSION     J02482.1  GI:216019
6 KEYWORDS    .
7 SOURCE      Enterobacteria phage phiX174
8   ORGANISM  Enterobacteria phage phiX174
9             Viruses; ssDNA viruses; Microviridae; Microvirus.
10 REFERENCE   1  (bases 1047 to 1094)
11   AUTHORS   Ziff,E.B., Sedat,J.W. and Galibert,F.
12   TITLE     Determination of the nucleotide sequence of a fragment of
13             bacteriophage phiX 174 DNA
14   JOURNAL   Nature New Biol. 241 (106), 34-37 (1973)
15    PUBMED   4349156
16 REFERENCE   2  (bases 2370 to 2421)
17   AUTHORS   Robertson,H.D., Barrell,B.G., Weith,H.L. and Donelson,J.E.
18   TITLE     Isolation and sequence analysis of a ribosome-protected fragment
19             from bacteriophage phiX 174 DNA
20   JOURNAL   Nature New Biol. 241 (106), 38-40 (1973)
21    PUBMED   4572838
22 REFERENCE   3  (bases 2370 to 2420)
23   AUTHORS   Barrell,B.G., Weith,H.L., Donelson,J.E. and Robertson,H.D.
24   TITLE     Sequence analysis of the ribosome-protected bacteriophase phiX174
25             DNA fragment containing the gene G initiation site
26   JOURNAL   J. Mol. Biol. 92 (3), 377-393 (1975)
27    PUBMED   1095758
28 REFERENCE   4  (bases 2365 to 2591)
29   AUTHORS   Air,G.M., Blackburn,E.H., Sanger,F. and Coulson,A.R.
30   TITLE     The nucleotide and amino acid sequences of the N (5') terminal
31             region of gene G of bacteriophage phiphiX 174
32   JOURNAL   J. Mol. Biol. 96 (4), 703-719 (1975)
33    PUBMED   1081600
34 REFERENCE   5  (bases 2263 to 2421)
35   AUTHORS   Fiddes,J.C.
36   TITLE     Nucleotide sequence of the intercistronic region between genes G
37             and F in bacteriophage phiX174 DNA
38   JOURNAL   J. Mol. Biol. 107 (1), 1-24 (1976)
39    PUBMED   826639
40 REFERENCE   6  (bases 1017 to 1081)
41   AUTHORS   Sedat,J., Ziff,E. and Galibert,F.
42   TITLE     Direct determination of DNA nucleotide sequences. Structure of
43             large specific fragments of bacteriophage phiX174 DNA
44   JOURNAL   J. Mol. Biol. 107 (4), 391-416 (1976)
45    PUBMED   1003475
46 REFERENCE   7  (bases 730 to 903)
47   AUTHORS   Blackburn,E.H.
48   TITLE     Transcription and sequence analysis of a fragment of bacteriophage
49             phiX174 DNA
50   JOURNAL   J. Mol. Biol. 107 (4), 417-431 (1976)
51    PUBMED   826641
52 REFERENCE   8  (bases 1017 to 1762)
53   AUTHORS   Air,G.M., Blackburn,E.H., Coulson,A.R., Galibert,F., Sanger,F.,
54             Sedat,J.W. and Ziff,E.B.
55   TITLE     Gene F of bacteriophage phiX174. Correlation of nucleotide
56             sequences from the DNA and amino acid sequences from the gene
57             product
58   JOURNAL   J. Mol. Biol. 107 (4), 445-458 (1976)
59    PUBMED   1088826
60 REFERENCE   9  (bases 2395 to 2922)
61   AUTHORS   Air,G.M., Sanger,F. and Coulson,A.R.
62   TITLE     Nucleotide and amino acid sequences of gene G of omegaX174
63   JOURNAL   J. Mol. Biol. 108 (3), 519-533 (1976)
64    PUBMED   1088827
65 REFERENCE   10 (bases 4137 to 4207)
66   AUTHORS   Mansfeld,A.D., Vereijken,J.M. and Jansz,H.S.
67   TITLE     The nucleotide sequence of a DNA fragment, 71 base pairs in length,
68             near the origin of DNA replication of bacteriophage 0X174
69   JOURNAL   Nucleic Acids Res. 3 (10), 2827-2844 (1976)
70    PUBMED   995652
71 REFERENCE   11 (bases 4505 to 5374)
72   AUTHORS   Brown,N.L. and Smith,M.
73   TITLE     The sequence of a region of bacteriophage phiX174 DNA coding for
74             parts of genes A and B
75   JOURNAL   J. Mol. Biol. 116 (1), 1-28 (1977)
76    PUBMED   592379
77 REFERENCE   12 (bases 1 to 5375)
78   AUTHORS   Sanger,F., Air,G.M., Barrell,B.G., Brown,N.L., Coulson,A.R.,
79             Fiddes,C.A., Hutchison,C.A., Slocombe,P.M. and Smith,M.
80   TITLE     Nucleotide sequence of bacteriophage phi X174 DNA
81   JOURNAL   Nature 265 (5596), 687-695 (1977)
82    PUBMED   870828
83 REFERENCE   13 (bases 5022 to 5132)
84   AUTHORS   Brown,N.L. and Smith,M.
85   TITLE     DNA sequence of a region of the phi X174 genome coding for a
86             ribosome binding site
87   JOURNAL   Nature 265 (5596), 695-698 (1977)
88    PUBMED   859573
89 REFERENCE   14 (bases 5346 to 5386; 1 to 159)
90   AUTHORS   Smith,M., Brown,N.L., Air,G.M., Barrell,B.G., Coulson,A.R.,
91             Hutchison,C.A. III and Sanger,F.
92   TITLE     DNA sequence at the C termini of the overlapping genes A and B in
93             bacteriophage phi X174
94   JOURNAL   Nature 265 (5596), 702-705 (1977)
95    PUBMED   859575
96 REFERENCE   15 (sites)
97   AUTHORS   Fiddes,J.C.
98   TITLE     The nucleotide sequence of a viral DNA
99   JOURNAL   Sci. Am. 237 (6), 54-67 (1977)
100    PUBMED   929160
101 REFERENCE   16 (bases 1 to 5386)
102   AUTHORS   Sanger,F., Coulson,A.R., Friedmann,T., Air,G.M., Barrell,B.G.,
103             Brown,N.L., Fiddes,J.C., Hutchison,C.A. III, Slocombe,P.M. and
104             Smith,M.
105   TITLE     The nucleotide sequence of bacteriophage phiX174
106   JOURNAL   J. Mol. Biol. 125 (2), 225-246 (1978)
107    PUBMED   731693
108 REFERENCE   17 (bases 1290 to 1302; 1340 to 1430; 1510 to 1570; 1600 to 1750)
109   AUTHORS   Air,G.M., Coulson,A.R., Fiddes,J.C., Friedmann,T., Hutchison,C.A.
110             III, Sanger,F., Slocombe,P.M. and Smith,A.J.
111   TITLE     Nucleotide sequence of the F protein coding region of bacteriophage
112             phiX174 and the amino acid sequence of its product
113   JOURNAL   J. Mol. Biol. 125 (2), 247-254 (1978)
114    PUBMED   731694
115 REFERENCE   18 (bases 4256 to 4317)
116   AUTHORS   Langeveld,S.A., van Mansfeld,A.D., de Winter,J.M. and Weisbeek,P.J.
117   TITLE     Cleavage of single-stranded DNA by the A and A* proteins of
118             bacteriophage phi X174
119   JOURNAL   Nucleic Acids Res. 7 (8), 2177-2188 (1979)
120    PUBMED   160544
121 REFERENCE   19 (bases 4248 to 4332)
122   AUTHORS   Heidekamp,F., Langeveld,S.A., Baas,P.D. and Jansz,H.S.
123   TITLE     Studies of the recognition sequence of phi X174 gene A protein.
124             Cleavage site of phi X gene A protein in St-1 RFI DNA
125   JOURNAL   Nucleic Acids Res. 8 (9), 2009-2021 (1980)
126    PUBMED   6253953
127 REFERENCE   20 (bases 436 to 490; 630 to 669; 930 to 979)
128   AUTHORS   Takeshita,M., Kappen,L.S., Grollman,A.P., Eisenberg,M. and
129             Goldberg,I.H.
130   TITLE     Strand scission of deoxyribonucleic acid by neocarzinostatin,
131             auromomycin, and bleomycin: studies on base release and nucleotide
132             sequence specificity
133   JOURNAL   Biochemistry 20 (26), 7599-7606 (1981)
134    PUBMED   6173064
135 REFERENCE   22 (bases 1064 to 1757)
136   AUTHORS   Merville,M.P., Piette,J., Lopez,M., Decuyper,J. and van de Vorst,A.
137   TITLE     Termination sites of the in vitro DNA synthesis on single-stranded
138             DNA photosensitized by promazines
139   JOURNAL   J. Biol. Chem. 259 (24), 15069-15077 (1984)
140    PUBMED   6239864
141 REFERENCE   23 (bases 2380 to 2512; 2593 to 2786; 2788 to 2947)
142   AUTHORS   Air,G.M., Els,M.C., Brown,L.E., Laver,W.G. and Webster,R.G.
143   TITLE     Location of antigenic sites on the three-dimensional structure of
144             the influenza N2 virus neuraminidase
145   JOURNAL   Virology 145 (2), 237-248 (1985)
146    PUBMED   2411049
147 REFERENCE   24 (bases 449 to 482; 504 to 598; 1047 to 1111)
148   AUTHORS   Ueda,K., Morita,J. and Komano,T.
149   TITLE     Sequence specificity of heat-labile sites in DNA induced by
150             mitomycin C
151   JOURNAL   Biochemistry 23 (8), 1634-1640 (1984)
152    PUBMED   6232949
153 COMMENT     On Apr 28, 2004 this sequence version replaced gi:15535.
154             [8]  intermittent sequences.
155             [15]  review; discussion of complete genome.
156             Double checked with sumex tape.
157             Single-stranded circular DNA which codes for eleven proteins.
158             Replicative form is duplex, icosahedron, related to s13 & g4. [21]
159             indicates that mitomycin C reduced with sodium borohydride induced
160             heat-labile sites in DNA most preferentially at dinucleotide
161             sequence 'gt' (especially 'Pu-g-t').
162             Bacteriophage phi-X174 single stranded DNA molecules were
163             irradiated with near UV light in the presence of promazine
164             derivatives, after priming with restriction fragments or synthetic
165             primers [22].  The resulting DNA fragments were used as templates
166             for in vitro complementary chain synthesis by E.coli DNA polymerase
167             I [22].  More than 90% of the observed chain terminations were
168             mapped one nucleotide before a guanine residue [22].  Photoreaction
169             occurred more predominantly with guanine residues localized in
170             single-stranded parts of the genome [22].  These same guanine
171             residues could also be damaged when the reaction was performed in
172             the dark, in the presence of promazine cation radicals [22].
173 FEATURES             Location/Qualifiers
174      source          1..5386
175                      /organism="Enterobacteria phage phiX174"
176                      /mol_type="genomic DNA"
177                      /db_xref="taxon:10847"
178      CDS             join(3981..5386,1..136)
179                      /function="viral strand synthesis"
180                      /note="rf replication"
181                      /codon_start=1
182                      /transl_table=11
183                      /product="A"
184                      /protein_id="AAA32570.1"
185                      /db_xref="GI:216020"
186                      /translation="MVRSYYPSECHADYFDFERIEALKPAIEACGISTLSQSPMLGFH
187                      KQMDNRIKLLEEILSFRMQGVEFDNGDMYVDGHKAASDVRDEFVSVTEKLMDELAQCY
188                      NVLPQLDINNTIDHRPEGDEKWFLENEKTVTQFCRKLAAERPLKDIRDEYNYPKKKGI
189                      KDECSRLLEASTMKSRRGFAIQRLMNAMRQAHADGWFIVFDTLTLADDRLEAFYDNPN
190                      ALRDYFRDIGRMVLAAEGRKANDSHADCYQYFCVPEYGTANGRLHFHAVHFMRTLPTG
191                      SVDPNFGRRVRNRRQLNSLQNTWPYGYSMPIAVRYTQDAFSRSGWLWPVDAKGEPLKA
192                      TSYMAVGFYVAKYVNKKSDMDLAAKGLGAKEWNNSLKTKLSLLPKKLFRIRMSRNFGM
193                      KMLTMTNLSTECLIQLTKLGYDATPFNQILKQNAKREMRLRLGKVTVADVLAAQPVTT
194                      NLLKFMRASIKMIGVSNLQSFIASMTQKLTLSDISDESKNYLDKAGITTACLRIKSKW
195                      TAGGK"
196      CDS             join(4497..5386,1..136)
197                      /function="shut off host DNA synthesis"
198                      /codon_start=1
199                      /transl_table=11
200                      /product="A*"
201                      /protein_id="AAA32571.1"
202                      /db_xref="GI:216021"
203                      /translation="MKSRRGFAIQRLMNAMRQAHADGWFIVFDTLTLADDRLEAFYDN
204                      PNALRDYFRDIGRMVLAAEGRKANDSHADCYQYFCVPEYGTANGRLHFHAVHFMRTLP
205                      TGSVDPNFGRRVRNRRQLNSLQNTWPYGYSMPIAVRYTQDAFSRSGWLWPVDAKGEPL
206                      KATSYMAVGFYVAKYVNKKSDMDLAAKGLGAKEWNNSLKTKLSLLPKKLFRIRMSRNF
207                      GMKMLTMTNLSTECLIQLTKLGYDATPFNQILKQNAKREMRLRLGKVTVADVLAAQPV
208                      TTNLLKFMRASIKMIGVSNLQSFIASMTQKLTLSDISDESKNYLDKAGITTACLRIKS
209                      KWTAGGK"
210      CDS             join(5075..5386,1..51)
211                      /function="capsid morphogenesis"
212                      /codon_start=1
213                      /transl_table=11
214                      /product="B"
215                      /protein_id="AAA32572.1"
216                      /db_xref="GI:216022"
217                      /translation="MEQLTKNQAVATSQEAVQNQNEPQLRDENAHNDKSVHGVLNPTY
218                      QAGLRRDAVQPDIEAERKKRDEIEAGKSYCSRRFGGATCDDKSAQIYARFDKNDWRIQ
219                      PAEFYRFHDAEVNTFGYF"
220      variation       23
221                      /note="in am18 and am35 [14]"
222                      /replace="t"
223      variation       25
224                      /note="ts116 [14]"
225                      /replace="c"
226      CDS             51..221
227                      /codon_start=1
228                      /transl_table=11
229                      /product="K"
230                      /protein_id="AAA32573.1"
231                      /db_xref="GI:216023"
232                      /translation="MSRKIILIKQELLLLVYELNRSGLLAENEKIRPILAQLEKLLLC
233                      DLSPSTNDSVKN"
234      variation       57
235                      /note="am6 [14]"
236                      /replace="c"
237      variation       117
238                      /note="am6 [14]"
239                      /replace="a"
240      CDS             133..393
241                      /note="DNA maturation"
242                      /codon_start=1
243                      /transl_table=11
244                      /product="C"
245                      /protein_id="AAA32574.1"
246                      /db_xref="GI:216024"
247                      /translation="MRKFDLSLRSSRSSYFATFRHQLTILSKTDALDEEKWLNMLGTF
248                      VKDWFRYESHFVHGRDSLVDILKERGLLSESDAVQPLIGKKS"
249      mRNA            358..3975
250                      /product="major transcript"
251      mRNA            358..991
252                      /product="minor transcript"
253      CDS             390..848
254                      /function="capsid morphogenesis"
255                      /codon_start=1
256                      /transl_table=11
257                      /product="D"
258                      /protein_id="AAA32575.1"
259                      /db_xref="GI:216025"
260                      /translation="MSQVTEQSVRFQTALASIKLIQASAVLDLTEDDFDFLTSNKVWI
261                      ATDRSRARRCVEACVYGTLDFVGYPRFPAPVEFIAAVIAYYVHPVNIQTACLIMEGAE
262                      FTENIINGVERPVKAAELFAFTLRVRAGNTDVLTDAEENVRQKLRAEGVM"
263      CDS             568..843
264                      /function="cell lysis"
265                      /codon_start=1
266                      /transl_table=11
267                      /product="E"
268                      /protein_id="AAA32576.1"
269                      /db_xref="GI:216026"
270                      /translation="MVRWTLWDTLAFLLLLSLLLPSLLIMFIPSTFKRPVSSWKALNL
271                      RKTLLMASSVRLKPLNCSRLPCVYAQETLTFLLTQKKTCVKNYVRKE"
272      CDS             848..964
273                      /note="core protein; DNA condensation"
274                      /codon_start=1
275                      /transl_table=11
276                      /product="J"
277                      /protein_id="AAA32577.1"
278                      /db_xref="GI:216027"
279                      /translation="MSKGKKRSGARPGRPQPLRGTKGKRKGARLWYVGGQQF"
280      CDS             1001..2284
281                      /note="major coat protein"
282                      /codon_start=1
283                      /transl_table=11
284                      /product="F"
285                      /protein_id="AAA32578.1"
286                      /db_xref="GI:216028"
287                      /translation="MSNIQTGAERMPHDLSHLGFLAGQIGRLITISTTPVIAGDSFEM
288                      DAVGALRLSPLRRGLAIDSTVDIFTFYVPHRHVYGEQWIKFMKDGVNATPLPTVNTTG
289                      YIDHAAFLGTINPDTNKIPKHLFQGYLNIYNNYFKAPWMPDRTEANPNELNQDDARYG
290                      FRCCHLKNIWTAPLPPETELSRQMTTSTTSIDIMGLQAAYANLHTDQERDYFMQRYHD
291                      VISSFGGKTSYDADNRPLLVMRSNLWASGYDVDGTDQTSLGQFSGRVQQTYKHSVPRF
292                      FVPEHGTMFTLALVRFPPTATKEIQYLNAKGALTYTDIAGDPVLYGNLPPREISMKDV
293                      FRSGDSSKKFKIAEGQWYRYAPSYVSPAYHLLEGFPFIQEPPSGDLQERVLIRHHDYD
294                      QCFQSVQLLQWNSQVKFNVTVYRNLPTTRDSIMTS"
295      CDS             2395..2922
296                      /note="major spike protein"
297                      /codon_start=1
298                      /transl_table=11
299                      /product="G"
300                      /protein_id="AAA32579.1"
301                      /db_xref="GI:216029"
302                      /translation="MFQTFISRHNSNFFSDKLVLTSVTPASSAPVLQTPKATSSTLYF
303                      DSLTVNAGNGGFLHCIQMDTSVNAANQVVSVGADIAFDADPKFFACLVRFESSSVPTT
304                      LPTAYDVYPLNGRHDGGYYTVKDCVTIDVLPRTPGNNVYVGFMVWSNFTATKCRGLVS
305                      LNQVIKEIICLQPLK"
306      CDS             2931..3917
307                      /function="adsorption"
308                      /note="minor spike protein"
309                      /codon_start=1
310                      /transl_table=11
311                      /product="H"
312                      /protein_id="AAA32580.1"
313                      /db_xref="GI:216030"
314                      /translation="MFGAIAGGIASALAGGAMSKLFGGGQKAASGGIQGDVLATDNNT
315                      VGMGDAGIKSAIQGSNVPNPDEAAPSFVSGAMAKAGKGLLEGTLQAGTSAVSDKLLDL
316                      VGLGGKSAADKGKDTRDYLAAAFPELNAWERAGADASSAGMVDAGFENQKELTKMQLD
317                      NQKEIAEMQNETQKEIAGIQSATSRQNTKDQVYAQNEMLAYQQKESTARVASIMENTN
318                      LSKQQQVSEIMRQMLTQAQTAGQYFTNDQIKEMTRKVSAEVDLVHQQTQNQRYGSSHI
319                      GATAKDISNVVTDAASGVVDIFHGIDKAVADTWNNFWKDGKADGIGSNLSRK"
320      misc_feature    3962
321                      /note="transcription start site"
322      rep_origin      4306
323                      /note="origin of viral strand synthesis"
324      misc_feature    4899
325                      /note="transcription start site"
326 ORIGIN      
327         1 gagttttatc gcttccatga cgcagaagtt aacactttcg gatatttctg atgagtcgaa
328        61 aaattatctt gataaagcag gaattactac tgcttgttta cgaattaaat cgaagtggac
329       121 tgctggcgga aaatgagaaa attcgaccta tccttgcgca gctcgagaag ctcttacttt
330       181 gcgacctttc gccatcaact aacgattctg tcaaaaactg acgcgttgga tgaggagaag
331       241 tggcttaata tgcttggcac gttcgtcaag gactggttta gatatgagtc acattttgtt
332       301 catggtagag attctcttgt tgacatttta aaagagcgtg gattactatc tgagtccgat
333       361 gctgttcaac cactaatagg taagaaatca tgagtcaagt tactgaacaa tccgtacgtt
334       421 tccagaccgc tttggcctct attaagctca ttcaggcttc tgccgttttg gatttaaccg
335       481 aagatgattt cgattttctg acgagtaaca aagtttggat tgctactgac cgctctcgtg
336       541 ctcgtcgctg cgttgaggct tgcgtttatg gtacgctgga ctttgtggga taccctcgct
337       601 ttcctgctcc tgttgagttt attgctgccg tcattgctta ttatgttcat cccgtcaaca
338       661 ttcaaacggc ctgtctcatc atggaaggcg ctgaatttac ggaaaacatt attaatggcg
339       721 tcgagcgtcc ggttaaagcc gctgaattgt tcgcgtttac cttgcgtgta cgcgcaggaa
340       781 acactgacgt tcttactgac gcagaagaaa acgtgcgtca aaaattacgt gcggaaggag
341       841 tgatgtaatg tctaaaggta aaaaacgttc tggcgctcgc cctggtcgtc cgcagccgtt
342       901 gcgaggtact aaaggcaagc gtaaaggcgc tcgtctttgg tatgtaggtg gtcaacaatt
343       961 ttaattgcag gggcttcggc cccttacttg aggataaatt atgtctaata ttcaaactgg
344      1021 cgccgagcgt atgccgcatg acctttccca tcttggcttc cttgctggtc agattggtcg
345      1081 tcttattacc atttcaacta ctccggttat cgctggcgac tccttcgaga tggacgccgt
346      1141 tggcgctctc cgtctttctc cattgcgtcg tggccttgct attgactcta ctgtagacat
347      1201 ttttactttt tatgtccctc atcgtcacgt ttatggtgaa cagtggatta agttcatgaa
348      1261 ggatggtgtt aatgccactc ctctcccgac tgttaacact actggttata ttgaccatgc
349      1321 cgcttttctt ggcacgatta accctgatac caataaaatc cctaagcatt tgtttcaggg
350      1381 ttatttgaat atctataaca actattttaa agcgccgtgg atgcctgacc gtaccgaggc
351      1441 taaccctaat gagcttaatc aagatgatgc tcgttatggt ttccgttgct gccatctcaa
352      1501 aaacatttgg actgctccgc ttcctcctga gactgagctt tctcgccaaa tgacgacttc
353      1561 taccacatct attgacatta tgggtctgca agctgcttat gctaatttgc atactgacca
354      1621 agaacgtgat tacttcatgc agcgttacca tgatgttatt tcttcatttg gaggtaaaac
355      1681 ctcttatgac gctgacaacc gtcctttact tgtcatgcgc tctaatctct gggcatctgg
356      1741 ctatgatgtt gatggaactg accaaacgtc gttaggccag ttttctggtc gtgttcaaca
357      1801 gacctataaa cattctgtgc cgcgtttctt tgttcctgag catggcacta tgtttactct
358      1861 tgcgcttgtt cgttttccgc ctactgcgac taaagagatt cagtacctta acgctaaagg
359      1921 tgctttgact tataccgata ttgctggcga ccctgttttg tatggcaact tgccgccgcg
360      1981 tgaaatttct atgaaggatg ttttccgttc tggtgattcg tctaagaagt ttaagattgc
361      2041 tgagggtcag tggtatcgtt atgcgccttc gtatgtttct cctgcttatc accttcttga
362      2101 aggcttccca ttcattcagg aaccgccttc tggtgatttg caagaacgcg tacttattcg
363      2161 ccaccatgat tatgaccagt gtttccagtc cgttcagttg ttgcagtgga atagtcaggt
364      2221 taaatttaat gtgaccgttt atcgcaatct gccgaccact cgcgattcaa tcatgacttc
365      2281 gtgataaaag attgagtgtg aggttataac gccgaagcgg taaaaatttt aatttttgcc
366      2341 gctgaggggt tgaccaagcg aagcgcggta ggttttctgc ttaggagttt aatcatgttt
367      2401 cagactttta tttctcgcca taattcaaac tttttttctg ataagctggt tctcacttct
368      2461 gttactccag cttcttcggc acctgtttta cagacaccta aagctacatc gtcaacgtta
369      2521 tattttgata gtttgacggt taatgctggt aatggtggtt ttcttcattg cattcagatg
370      2581 gatacatctg tcaacgccgc taatcaggtt gtttctgttg gtgctgatat tgcttttgat
371      2641 gccgacccta aattttttgc ctgtttggtt cgctttgagt cttcttcggt tccgactacc
372      2701 ctcccgactg cctatgatgt ttatcctttg aatggtcgcc atgatggtgg ttattatacc
373      2761 gtcaaggact gtgtgactat tgacgtcctt ccccgtacgc cgggcaataa cgtttatgtt
374      2821 ggtttcatgg tttggtctaa ctttaccgct actaaatgcc gcggattggt ttcgctgaat
375      2881 caggttatta aagagattat ttgtctccag ccacttaagt gaggtgattt atgtttggtg
376      2941 ctattgctgg cggtattgct tctgctcttg ctggtggcgc catgtctaaa ttgtttggag
377      3001 gcggtcaaaa agccgcctcc ggtggcattc aaggtgatgt gcttgctacc gataacaata
378      3061 ctgtaggcat gggtgatgct ggtattaaat ctgccattca aggctctaat gttcctaacc
379      3121 ctgatgaggc cgcccctagt tttgtttctg gtgctatggc taaagctggt aaaggacttc
380      3181 ttgaaggtac gttgcaggct ggcacttctg ccgtttctga taagttgctt gatttggttg
381      3241 gacttggtgg caagtctgcc gctgataaag gaaaggatac tcgtgattat cttgctgctg
382      3301 catttcctga gcttaatgct tgggagcgtg ctggtgctga tgcttcctct gctggtatgg
383      3361 ttgacgccgg atttgagaat caaaaagagc ttactaaaat gcaactggac aatcagaaag
384      3421 agattgccga gatgcaaaat gagactcaaa aagagattgc tggcattcag tcggcgactt
385      3481 cacgccagaa tacgaaagac caggtatatg cacaaaatga gatgcttgct tatcaacaga
386      3541 aggagtctac tgctcgcgtt gcgtctatta tggaaaacac caatctttcc aagcaacagc
387      3601 aggtttccga gattatgcgc caaatgctta ctcaagctca aacggctggt cagtatttta
388      3661 ccaatgacca aatcaaagaa atgactcgca aggttagtgc tgaggttgac ttagttcatc
389      3721 agcaaacgca gaatcagcgg tatggctctt ctcatattgg cgctactgca aaggatattt
390      3781 ctaatgtcgt cactgatgct gcttctggtg tggttgatat ttttcatggt attgataaag
391      3841 ctgttgccga tacttggaac aatttctgga aagacggtaa agctgatggt attggctcta
392      3901 atttgtctag gaaataaccg tcaggattga caccctccca attgtatgtt ttcatgcctc
393      3961 caaatcttgg aggctttttt atggttcgtt cttattaccc ttctgaatgt cacgctgatt
394      4021 attttgactt tgagcgtatc gaggctctta aacctgctat tgaggcttgt ggcatttcta
395      4081 ctctttctca atccccaatg cttggcttcc ataagcagat ggataaccgc atcaagctct
396      4141 tggaagagat tctgtctttt cgtatgcagg gcgttgagtt cgataatggt gatatgtatg
397      4201 ttgacggcca taaggctgct tctgacgttc gtgatgagtt tgtatctgtt actgagaagt
398      4261 taatggatga attggcacaa tgctacaatg tgctccccca acttgatatt aataacacta
399      4321 tagaccaccg ccccgaaggg gacgaaaaat ggtttttaga gaacgagaag acggttacgc
400      4381 agttttgccg caagctggct gctgaacgcc ctcttaagga tattcgcgat gagtataatt
401      4441 accccaaaaa gaaaggtatt aaggatgagt gttcaagatt gctggaggcc tccactatga
402      4501 aatcgcgtag aggctttgct attcagcgtt tgatgaatgc aatgcgacag gctcatgctg
403      4561 atggttggtt tatcgttttt gacactctca cgttggctga cgaccgatta gaggcgtttt
404      4621 atgataatcc caatgctttg cgtgactatt ttcgtgatat tggtcgtatg gttcttgctg
405      4681 ccgagggtcg caaggctaat gattcacacg ccgactgcta tcagtatttt tgtgtgcctg
406      4741 agtatggtac agctaatggc cgtcttcatt tccatgcggt gcactttatg cggacacttc
407      4801 ctacaggtag cgttgaccct aattttggtc gtcgggtacg caatcgccgc cagttaaata
408      4861 gcttgcaaaa tacgtggcct tatggttaca gtatgcccat cgcagttcgc tacacgcagg
409      4921 acgctttttc acgttctggt tggttgtggc ctgttgatgc taaaggtgag ccgcttaaag
410      4981 ctaccagtta tatggctgtt ggtttctatg tggctaaata cgttaacaaa aagtcagata
411      5041 tggaccttgc tgctaaaggt ctaggagcta aagaatggaa caactcacta aaaaccaagc
412      5101 tgtcgctact tcccaagaag ctgttcagaa tcagaatgag ccgcaacttc gggatgaaaa
413      5161 tgctcacaat gacaaatctg tccacggagt gcttaatcca acttaccaag ctgggttacg
414      5221 acgcgacgcc gttcaaccag atattgaagc agaacgcaaa aagagagatg agattgaggc
415      5281 tgggaaaagt tactgtagcc gacgttttgg cggcgcaacc tgtgacgaca aatctgctca
416      5341 aatttatgcg cgcttcgata aaaatgattg gcgtatccaa cctgca