Bio::DB::TFBS namespace has been moved to its own distribution named after itself
[bioperl-live.git] / t / data / BN000066-tpa.embl
blob026dd2502612f42a831335330c2b9d5371c8091c
2 ID   AGA000066  standard; DNA; INV; 5195 BP.
3 XX
4 AC   BN000066;
5 XX
6 SV   BN000066.1
7 XX
8 DT   07-OCT-2002 (Rel. 73, Created)
9 DT   21-NOV-2002 (Rel. 73, Last updated, Version 11)
11 DE   TPA: Anopheles gambiae achE1 gene for acetylcholinesterase, exons 1-6
13 KW   acetylcholinesterase; achE1 gene; Third Party Annotation; TPA.
15 OS   Anopheles gambiae (African malaria mosquito)
16 OC   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera;
17 OC   Endopterygota; Diptera; Nematocera; Culicoidea; Anopheles.
19 RN   [1]
20 RP   1-5195
21 RA   Fort P.P.;
22 RT   ;
23 RL   Submitted (30-NOV-2001) to the EMBL/GenBank/DDBJ databases.
24 RL   Fort P.P., CRBM-UPR1086, Cnrs, 1919 route de Mende, 34293 MONTPELLIER CEDEX
25 RL   5, FRANCE.
27 RN   [3]
28 RA   Weill M., Fort P., Berthomi eu A., Dubois M.P., Pasteur N., Raymond M.;
29 RT   "A novel acetylcholinesterase gene in mosquitoes codes for the insecticide
30 RT   target and is non-homologous to the ace gene in Drosophila";
31 RL   Proc. R. Soc. Lond., B, Biol. Sci. 269:2007-2016(2002).
33 CC   see also AJ488492 for achE-1 from Kisumu strain
34 CC   Third Party Annotation Database: This TPA record uses Anopheles gambiae
35 CC   trace archive data (http://trace.ensembl.org)
37 AH   TPA_SPAN        PRIMARY_IDENTIFIER   PRIMARY_SPAN   COMP
38 AS   1-685           TI55475028           11-685             
39 AS   1-747           TI47553499           11-747             
40 AS   1-800           TI55407518           11-800             
41 AS   188-895         TI57630934           11-707             
42 AS   223-845         TI57283198           11-622             
43 AS   251-895         TI47098900           11-644             
44 AS   272-999         TI56725015           11-727             
45 AS   387-1193        TI57310066           11-806             
46 AS   431-1195        TI56845856           11-764             
47 AS   522-1220        TI55215818           11-698             
48 AS   546-1208        TI57401582           11-661             
49 AS   566-1208        TI56169014           11-642             
50 AS   584-1306        TI59761948           11-722             
51 AS   738-1306        TI55852606           11-568             
52 AS   827-1634        TI57602219           11-807             
53 AS   1064-1769       TI44966390           11-705             
54 AS   1065-1822       TI60742945           11-757             
55 AS   1129-1954       TI56042882           11-825             
56 AS   1223-1979       TI60461178           11-756             
57 AS   1226-1868       TI56472916           11-642             
58 AS   1296-1989       TI44952509           11-693             
59 AS   1364-2170       TI56006358           11-806             
60 AS   1561-2341       TI58704241           11-780             
61 AS   1582-2385       TI44875600           11-803             
62 AS   1740-2415       TI55894404           11-675             
63 AS   1794-2585       TI56056818           11-791             
64 AS   1834-2644       TI47256770           11-809             
65 AS   1848-2729       TI56446066           11-879             
66 AS   1849-2515       TI44984669           11-665             
67 AS   2216-3002       TI57417259           11-786             
68 AS   2224-3029       TI56867244           11-805             
69 AS   2226-3057       TI59803037           11-831             
70 AS   2299-3083       TI60503347           11-784             
71 AS   2614-3351       TI44891398           11-736             
72 AS   2654-3419       TI55336738           11-765             
73 AS   2663-3304       TI60709914           11-641             
74 AS   2672-3417       TI56453591           11-745             
75 AS   2691-3260       TI55690247           11-569             
76 AS   2697-3494       TI55745954           11-797             
77 AS   2885-3706       TI58733608           11-821             
78 AS   2896-3700       TI58130218           11-803             
79 AS   2946-3741       TI56432498           11-795             
80 AS   2992-3702       TI47561255           11-710             
81 AS   2992-3702       TI55208429           11-710             
82 AS   3029-3807       TI47256418           11-778             
83 AS   3030-3831       TI47233061           11-801             
84 AS   3123-3892       TI55870944           11-769             
85 AS   3255-4043       TI47465031           11-787             
86 AS   3325-4045       TI55382589           11-720             
87 AS   3535-4255       TI46993841           11-720             
88 AS   3574-4244       TI56607077           11-670             
89 AS   3596-4394       TI56526265           11-798             
90 AS   3704-4484       TI56050293           11-780             
91 AS   3724-4560       TI59807029           11-836             
92 AS   3745-4549       TI55159438           11-804             
93 AS   3753-4596       TI56586965           11-842             
94 AS   3800-4577       TI56592754           11-777             
95 AS   3833-4635       TI47243257           11-801             
96 AS   3837-4272       TI59628661           11-435             
97 AS   3899-4728       TI56895999           11-829             
98 AS   3938-4704       TI59830483           11-766             
99 AS   3942-4704       TI55700050           11-762             
100 AS   4116-4912       TI56961976           11-796             
101 AS   4137-4761       TI46929238           11-623             
102 AS   4148-4961       TI59909853           11-813             
103 AS   4285-5046       TI47085450           11-759             
104 AS   4315-5069       TI58096045           11-754             
105 AS   4387-5177       TI58084392           11-790             
106 AS   4455-5175       TI55094688           11-720             
107 AS   4455-5195       TI55297322           11-740             
108 AS   4491-5195       TI56990277           11-704             
110 FH   Key             Location/Qualifiers
112 FT   source          1..5195
113 FT                   /db_xref="taxon:7165"
114 FT                   /organism="Anopheles gambiae"
115 FT   CDS             join(<1780..1914,2001..2538,2618..2815,2902..3609,
116 FT                   3676..3848,3956..4077)
117 FT                   /codon_start=3
118 FT                   /gene="achE1"
119 FT                   /product="acetylcholinesterase"
120 FT                   /EC_number="3.1.1.7"
121 FT                   /function="hydrolyzes acetylcholine at cholinergic
122 FT                   synapses"
123 FT                   /protein_id="CAD29865.2"
124 FT                   /translation="AFFTPYIGHGESVRIIDAELGTLEHVHSGATPRRRGLTRRESNSD
125 FT                   ANDNDPLVVNTDKGRIRGITVDAPSGKKVDVWLGIPYAQPPVGPLRFRHPRPAEKWTGV
126 FT                   LNTTTPPNSCVQIVDTVFGDFPGATMWNPNTPLSEDCLYINVVAPRPRPKNAAVMLWIF
127 FT                   GGGFYSGTATLDVYDHRALASEENVIVVSLQYRVASLGFLFLGTPEAPGNAGLFDQNLA
128 FT                   LRWVRDNIHRFGGDPSRVTLFGESAGAVSVSLHLLSALSRDLFQRAILQSGSPTAPWAL
129 FT                   VSREEATLRALRLAEAVGCPHEPSKLSDAVECLRGKDPHVLVNNEWGTLGICEFPFVPV
130 FT                   VDGAFLDETPQRSLASGRFKKTEILTGSNTEEGYYFIIYYLTELLRKEEGVTVTREEFL
131 FT                   QAVRELNPYVNGAARQAIVFEYTDWTEPDNPNSNRDALDKMVGDYHFTCNVNEFAQRYA
132 FT                   EEGNNVYMYLYTHRSKGNPWPRWTGVMHGDEINYVFGEPLNPTLGYTEDEKDFSRKIMR
133 FT                   YWSNFAKTGNPNPNTASSEFPEWPKHTAHGRHYLELGLNTSFVGRGPRLRQCAFWKKYL
134 FT                   PQLVAATSNLPGPAPPSEPCESSAFFYRPDLIVLLVSLLTATVRFIQ"
135 FT   mRNA            join(<1780..1914,2001..2538,2618..2815,2902..3609,
136 FT                   3676..3848,3956..>4596)
137 FT                   /gene="achE1"
138 FT   exon            <1780..1914
139 FT                   /number=1
140 FT                   /gene="achE1"
141 FT   intron          1915..2000
142 FT                   /number=1
143 FT                   /gene="achE1"
144 FT   exon            2001..2538
145 FT                   /number=2
146 FT                   /gene="achE1"
147 FT   intron          2539..2617
148 FT                   /number=2
149 FT                   /gene="achE1"
150 FT   exon            2618..2815
151 FT                   /number=3
152 FT                   /gene="achE1"
153 FT   intron          2816..2901
154 FT                   /number=3
155 FT                   /gene="achE1"
156 FT   exon            2902..3609
157 FT                   /number=4
158 FT                   /gene="achE1"
159 FT   intron          3610..3675
160 FT                   /number=4
161 FT                   /gene="achE1"
162 FT   exon            3676..3848
163 FT                   /number=5
164 FT                   /gene="achE1"
165 FT   intron          3849..3955
166 FT                   /number=5
167 FT                   /gene="achE1"
168 FT   exon            3956..>4596
169 FT                   /number=6
170 FT                   /gene="achE1"
171 FT   polyA_signal    4628..4633
172 FT                   /gene="achE1"
174 SQ   Sequence 5195 BP; 1326 A; 1468 C; 1183 G; 1218 T; 0 other;
175      gaggtggatt ggtacggatt ggtcatttcc gttcttcttc atgtgcgttt cttactctcc        60
176      tgccttctca aacgaacttc agaacgaaaa aaaacacgcg acggagagta agaagctgta       120
177      cagacactct agtcctcaca cacacaactt gcttactttg tccgtccgtt tgattccgct       180
178      ctttctatgt gtgactttct ggcacccttt acttcgtcac tattcatttc atttccaata       240
179      aacttttaat gtgtctttct tttttattct aaatatctat agtaaatgtt ctgtagcaag       300
180      tatcttgtag tagaattgta tagaagtaga tttttgtatg agtttgcatc atcccttccc       360
181      aatggggttg actccgtttc aaccaacgcc aaaagctatc ggcataaagt atggttcctt       420
182      gcaaaggctt ttatgaaaca cgaatgtgtt gaaagctttt gcaaatggaa atgttaaagc       480
183      ctttaagttc caatcgcttt ttgtatccat ttagtttgca tgaacaacag gaaatcaaaa       540
184      tattggtaac gacaatcgct ggcgggcgtt cctttcttgt ctaatcaaat catctacgat       600
185      tgtaattaca aacttccaag tttgcgtatg acaatgttaa atgtctaaga cgctcaaatg       660
186      caaccaatag agtataatta ctaaggcggg cagtagaaac caaaatatct taaataatgt       720
187      caagcaaaac aaaaagaaca attccgttca ctgctcaaag aaagccctaa ctaactacct       780
188      aaccttttca tcgatgaccc tgtactgaca tggtaagata ttctttatcc tttaactctt       840
189      ctgcacccta cgcactcaat gcaacacacg cactactatt actgctacta ctctcgcact       900
190      cacgagcacc tacttgcact caagccggca ctcaatgtac tagcgaaaca cgtcgcatct       960
191      aagcactcac aaggaagcac acatttgcaa atagcaccta ccggaacagc tttgaatgtg      1020
192      ccagcacagc attgaacagg ttcgcgcctt tactcctgtg ctctgttttc tcgatcggaa      1080
193      tgttcgaaag ttgaaaagcg cattttttca tctctctttt tctattcttc ttcgtatttt      1140
194      tatccctctc tcgtcgtgtt ttttctaaac attaccatac ttcttccgct acgaactcgc      1200
195      caagaaccag aacgcagcgt gcgtgcggtg cttgcggtgt gtgtgtgtgt gtgtgtattc      1260
196      cacggctgcg agaagcaaga tcggagaaca ggcatcattc ccctttcaca gacaattgca      1320
197      cttttgtact agaacagaaa acgagacagc ataatttcca acagcctcat tcactcatac      1380
198      caggctcaca ccgactttta accgaaacat gtactacaga aacaaaaaca aacaatatgg      1440
199      agagtgctcg cgctgatact aagttaatat gaagagatta ctggcgaggt catcgatccc      1500
200      atcccgacat catcgctcca ggctccagac ctaccaagtc gcctaccatt acctacccac      1560
201      caccgaccac tactcacaca gcattatcac ttccgccgcc gtcgccgccg ccgccgacgc      1620
202      cgccgacgcc accaccttca caccgccctg ccaaaatgaa tgcgcattgt tgcgatagat      1680
203      tgaatttcct tggttgttgt tgttgttggt tttcttttga catgtttgtg tgttgttttt      1740
204      tctttctctc tctctctttc tgtggttcca acatttcaga cgcatttttt acaccatata      1800
205      taggtcacgg tgagtccgta cgaattatag atgccgagtt gggcacgctc gagcatgtcc      1860
206      acagtggagc aacgccgcgg cgacgcggcc tgacgaggcg cgagtcaaac tcgggtaagt      1920
207      acgcgattgg aagtgggggg acgtttaccc taccgtgtac tactacaacg cactttaccc      1980
208      ccacgcacac gcaccggcag acgcgaacga caacgatccg ctggtggtca acacggataa      2040
209      ggggcgcatc cgcggcatta cggtcgatgc gcccagcggc aagaaggtgg acgtgtggct      2100
210      cggcattccc tacgcccagc cgccggtcgg gccgctacgg ttccgtcatc cgcggccggc      2160
211      cgaaaagtgg accggcgtgc tgaacacgac cacaccgccc aacagctgcg tgcagatcgt      2220
212      ggacaccgtg ttcggcgact tcccgggcgc gaccatgtgg aacccgaaca cgcccctgtc      2280
213      cgaggactgt ctgtacatta acgtggtggc accgcgaccc cggcccaaga atgcggccgt      2340
214      catgctgtgg atcttcggcg gcggcttcta ctccggcacc gccaccctgg acgtgtacga      2400
215      ccaccgggcg cttgcgtcgg aggagaacgt gatcgtggtg tcgctgcagt accgcgtggc      2460
216      cagtctgggc ttcctgtttc tcggcacccc ggaagcgccg ggcaatgcgg gactgttcga      2520
217      tcagaacctt gcgctacggt aggtgtcttt gcatgtgtga atgagggtat agtattctaa      2580
218      cgaggtgctc ttcttcccat cacttcttgg gagtcagctg ggtgcgggac aacattcacc      2640
219      ggttcggtgg cgatccgtcg cgtgtgacac tgttcggcga gagtgccggt gccgtctcgg      2700
220      tgtcgctgca tctgctgtcc gccctttccc gcgatctgtt ccagcgggcc atcctgcaga      2760
221      gcggctcgcc gacggcaccg tgggcattgg tatcgcgcga ggaagccaca ctaaggtacg      2820
222      tgccagctgc tgctttcccc aaaccaccaa cccgcaacag ctcacacaac cctcttttcc      2880
223      gtcgctcttt tctcgctcca gagcactgcg gttggccgag gcggtcggct gcccgcacga      2940
224      accgagcaag ctgagcgatg cggtcgagtg cctgcgcggc aaggacccgc acgtgctggt      3000
225      caacaacgag tggggcacgc tcggcatttg cgagttcccg ttcgtgccgg tggtcgacgg      3060
226      tgcgttcctg gacgagacgc cgcagcgttc gctcgccagc gggcgcttca agaagacgga      3120
227      gatcctcacc ggcagcaaca cggaggaggg ctactacttc atcatctact acctgaccga      3180
228      gctgctgcgc aaggaggagg gcgtgaccgt gacgcgcgag gagttcctgc aggcggtgcg      3240
229      cgagctcaac ccgtacgtga acggggcggc ccggcaggcg atcgtgttcg agtacaccga      3300
230      ctggaccgag ccggacaacc cgaacagcaa ccgggacgcg ctggacaaga tggtgggcga      3360
231      ctatcacttc acctgcaacg tgaacgagtt cgcgcagcgg tacgccgagg agggcaacaa      3420
232      cgtctacatg tatctgtaca cgcaccgcag caaaggcaac ccgtggccgc gctggacggg      3480
233      cgtgatgcac ggcgacgaga tcaactacgt gttcggcgaa ccgctcaacc ccaccctcgg      3540
234      ctacaccgag gacgagaaag actttagccg gaagatcatg cgatactggt ccaactttgc      3600
235      caaaaccggg taagtgtgtg tgtcaaacag cagagtgtcg atcgctctaa caccagcgtc      3660
236      ttctctcttc tacagcaatc caaatcccaa cacggccagc agcgaattcc ccgagtggcc      3720
237      caagcacacc gcccacggac ggcactatct ggagctgggc ctcaacacgt ccttcgtcgg      3780
238      tcggggccca cggttgaggc agtgtgcctt ctggaagaag taccttcccc agctagttgc      3840
239      agctacctgt aagtctcgtg cagcacttga aaccccctcc cacatcccca tcagggtcca      3900
240      ggttgcaata ataaatttca ctttctctct ctcacgtctc ttttccccaa aacagcgaac      3960
241      ctaccagggc cagcaccgcc tagtgaaccg tgcgaaagca gcgcattttt ttaccgacct      4020
242      gatctgatcg tgctgctggt gtcgctgctt acggcgaccg tcagattcat acaataatta      4080
243      ctaccccatc catggcctag ttcgtttaag ctttaagata gtgaggaaca aatttttccc      4140
244      aaacaatttt ccccccttta gagcagaacc gagggagaga taggactaca tagcgaaaag      4200
245      ggaaaacaag tggtggcgga cgaggagaga agaagcaaat cgaataatcg aagcaacaac      4260
246      aacaacaaca aaaaaactgc aaccgggttc actaaaccca gggggcagct cagtagcaaa      4320
247      ctactactta aataactact ttcttatggc aaattatggc aagagcagtc gtgatgggtt      4380
248      cgatcagtat ccatctgacc ggagcagctg aaccgtttca tgggcagttg ctgcaataca      4440
249      ccacgacccg tacacacagt aacacacttt ttatagcttt acactaacaa ccactctccc      4500
250      cacgctcctc ttccccttcc cctccacaca gacagcagcg ccgtttgtag caggatctac      4560
251      taccgtgcgg tttggtatgg cggccaacaa cactaaacac cacacatcta ctaaaacaca      4620
252      ccggaacaat aaacaaatgt taaacttact atatgaatat acatctagac gcatatatac      4680
253      gcatgaacta ctacttccct cgtgttctga caaaacacat taccttgtcc cccctccccc      4740
254      tccggtttgc ttaccaccac tgcaccacca gtatgaattt gttccataat aacgcttcgt      4800
255      aactcgttac caggagcaca actgggtcgt tggcggagtg ctgcgcgttt cgtgctgaag      4860
256      atgtaaacta gcaccgcgca cactttcgac acgcaaccac agctacacat cacgaaagca      4920
257      acatcctggc cctatccgtt ttctcattct taaaacttct ttccttagac caaaaccaac      4980
258      gcaaactagc aaaaggtact tgagtaaccg gtccagtaca cactgtgcta caattgagcg      5040
259      tagggaggag gtataatttc tgcaaaatgt ataaaacaaa actaaaacaa actaattact      5100
260      tgcaatccat tctaaagcac gaaaactcct caaaataaaa acgggaagta aacaaaaaaa      5160
261      tcagaacgaa caaatttacc taaaaaaaag taaac                                 5195