Bio::DB::TFBS namespace has been moved to its own distribution named after itself
[bioperl-live.git] / t / data / ar.embl
blob0414abecd7eb1078194e42290dc11f4400530574
1 ID   HSANDREC   standard; RNA; HUM; 3569 BP.
2 XX
3 AC   M20132; J03180;
4 XX
5 SV   M20132.1
6 XX
7 DT   23-NOV-1989 (Rel. 21, Created)
8 DT   02-JUL-1999 (Rel. 60, Last updated, Version 4)
9 XX
10 DE   Human androgen receptor (AR) mRNA, complete cds.
12 KW   androgen receptor.
14 OS   Homo sapiens (human)
15 OC   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Mammalia; Eutheria;
16 OC   Primates; Catarrhini; Hominidae; Homo.
18 RN   [1]
19 RP   1-3569
20 RX   MEDLINE; 89112208.
21 RA   Lubahn D.B., Joseph D.R., Sar M., Tan J., Higgs H.N., Larson R.E.,
22 RA   French F.S., Wilson E.M.;
23 RT   "The human androgen receptor: complementary deoxyribonucleic acid cloning,
24 RT   sequence analysis and gene expression in prostate";
25 RL   Mol. Endocrinol. 2(12):1265-1275(1988).
27 DR   GDB; 120556; AR.
28 DR   SWISS-PROT; P10275; ANDR_HUMAN.
29 DR   TRANSFAC; T00040; T00040.
31 CC   Draft entry and computer readable sequence [1] kindly submitted by
32 CC   E.M.Wilson, 18-AUG-1988.
34 FH   Key             Location/Qualifiers
36 FT   source          1..3569
37 FT                   /db_xref="taxon:9606"
38 FT                   /organism="Homo sapiens"
39 FT                   /map="Xq11.2-q12"
40 FT   gene            363..3122
41 FT                   /gene="AR"
42 FT   CDS             363..3122
43 FT                   /codon_start=1
44 FT                   /db_xref="SWISS-PROT:P10275"
45 FT                   /note="androgen receptor"
46 FT                   /gene="AR"
47 FT                   /protein_id="AAA51729.1"
48 FT                   /translation="MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAA
49 FT                   SAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTG
50 FT                   YLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLS
51 FT                   LLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDN
52 FT                   YLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTP
53 FT                   CAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELP
54 FT                   STLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAA
55 FT                   AAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGG
56 FT                   GGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPT
57 FT                   CVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTC
58 FT                   GSCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLG
59 FT                   NLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQP
60 FT                   DSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRS
61 FT                   FTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLL
62 FT                   FSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIAR
63 FT                   ELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ"
65 SQ   Sequence 3569 BP; 796 A; 1009 C; 974 G; 790 T; 0 other;
66      taataactca gttcttattt gcacctactt cagtggacac tgaatttgga aggtggagga        60
67      ttttgttttt ttcttttaag atctgggcat cttttgaatc tacccttcaa gtattaagag       120
68      acagactgtg agcctagcag ggcagatctt gtccaccgtg tgtcttcttc tgcacgagac       180
69      tttgaggctg tcagagcgct ttttgcgtgg ttgctcccgc aagtttcctt ctctggagct       240
70      tcccgcaggt gggcagctag ctgcagcgac taccgcatca tcacagcctg ttgaactctt       300
71      ctgagcaaga gaaggggagg cggggtaagg gaagtaggtg gaagattcag ccaagctcaa       360
72      ggatggaagt gcagttaggg ctgggaaggg tctaccctcg gccgccgtcc aagacctacc       420
73      gaggagcttt ccagaatctg ttccagagcg tgcgcgaagt gatccagaac ccgggcccca       480
74      ggcacccaga ggccgcgagc gcagcacctc ccggcgccag tttgctgctg ctgcagcagc       540
75      agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcaagaga       600
76      ctagccccag gcagcagcag cagcagcagg gtgaggatgg ttctccccaa gcccatcgta       660
77      gaggccccac aggctacctg gtcctggatg aggaacagca accttcacag ccgcagtcgg       720
78      ccctggagtg ccaccccgag agaggttgcg tcccagagcc tggagccgcc gtggccgcca       780
79      gcaaggggct gccgcagcag ctgccagcac ctccggacga ggatgactca gctgccccat       840
80      ccacgttgtc cctgctgggc cccactttcc ccggcttaag cagctgctcc gctgacctta       900
81      aagacatcct gagcgaggcc agcaccatgc aactccttca gcaacagcag caggaagcag       960
82      tatccgaagg cagcagcagc gggagagcga gggaggcctc gggggctccc acttcctcca      1020
83      aggacaatta cttagggggc acttcgacca tttctgacaa cgccaaggag ttgtgtaagg      1080
84      cagtgtcggt gtccatgggc ctgggtgtgg aggcgttgga gcatctgagt ccaggggaac      1140
85      agcttcgggg ggattgcatg tacgccccac ttttgggagt tccacccgct gtgcgtccca      1200
86      ctccttgtgc cccattggcc gaatgcaaag gttctctgct agacgacagc gcaggcaaga      1260
87      gcactgaaga tactgctgag tattcccctt tcaagggagg ttacaccaaa gggctagaag      1320
88      gcgagagcct aggctgctct ggcagcgctg cagcagggag ctccgggaca cttgaactgc      1380
89      cgtctaccct gtctctctac aagtccggag cactggacga ggcagctgcg taccagagtc      1440
90      gcgactacta caactttcca ctggctctgg ccggaccgcc gccccctccg ccgcctcccc      1500
91      atccccacgc tcgcatcaag ctggagaacc cgctggacta cggcagcgcc tgggcggctg      1560
92      cggcggcgca gtgccgctat ggggacctgg cgagcctgca tggcgcgggt gcagcgggac      1620
93      ccggttctgg gtcaccctca gccgccgctt cctcatcctg gcacactctc ttcacagccg      1680
94      aagaaggcca gttgtatgga ccgtgtggtg gtggtggggg tggtggcggc ggcggcggcg      1740
95      gcggcggcgg cggcggcggc ggcggcggcg gcggcggcga ggcgggagct gtagccccct      1800
96      acggctacac tcggccccct caggggctgg cgggccagga aagcgacttc accgcacctg      1860
97      atgtgtggta ccctggcggc atggtgagca gagtgcccta tcccagtccc acttgtgtca      1920
98      aaagcgaaat gggcccctgg atggatagct actccggacc ttacggggac atgcgtttgg      1980
99      agactgccag ggaccatgtt ttgcccattg actattactt tccaccccag aagacctgcc      2040
100      tgatctgtgg agatgaagct tctgggtgtc actatggagc tctcacatgt ggaagctgca      2100
101      aggtcttctt caaaagagcc gctgaaggga aacagaagta cctgtgcgcc agcagaaatg      2160
102      attgcactat tgataaattc cgaaggaaaa attgtccatc ttgtcgtctt cggaaatgtt      2220
103      atgaagcagg gatgactctg ggagcccgga agctgaagaa acttggtaat ctgaaactac      2280
104      aggaggaagg agaggcttcc agcaccacca gccccactga ggagacaacc cagaagctga      2340
105      cagtgtcaca cattgaaggc tatgaatgtc agcccatctt tctgaatgtc ctggaagcca      2400
106      ttgagccagg tgtagtgtgt gctggacacg acaacaacca gcccgactcc tttgcagcct      2460
107      tgctctctag cctcaatgaa ctgggagaga gacagcttgt acacgtggtc aagtgggcca      2520
108      aggccttgcc tggcttccgc aacttacacg tggacgacca gatggctgtc attcagtact      2580
109      cctggatggg gctcatggtg tttgccatgg gctggcgatc cttcaccaat gtcaactcca      2640
110      ggatgctcta cttcgcccct gatctggttt tcaatgagta ccgcatgcac aagtcccgga      2700
111      tgtacagcca gtgtgtccga atgaggcacc tctctcaaga gtttggatgg ctccaaatca      2760
112      ccccccagga attcctgtgc atgaaagcac tgctactctt cagcattatt ccagtggatg      2820
113      ggctgaaaaa tcaaaaattc tttgatgaac ttcgaatgaa ctacatcaag gaactcgatc      2880
114      gtatcattgc atgcaaaaga aaaaatccca catcctgctc aagacgcttc taccagctca      2940
115      ccaagctcct ggactccgtg cagcctattg cgagagagct gcatcagttc acttttgacc      3000
116      tgctaatcaa gtcacacatg gtgagcgtgg actttccgga aatgatggca gagatcatct      3060
117      ctgtgcaagt gcccaagatc ctttctggga aagtcaagcc catctatttc cacacccagt      3120
118      gaagcattgg aaaccctatt tccccacccc agctcatgcc ccctttcaga tgtcttctgc      3180
119      ctgttataac tctgcactac tcctctgcag tgccttgggg aatttcctct attgatgtac      3240
120      agtctgtcat gaacatgttc ctgaattcta tttgctgggc tttttttttc tctttctctc      3300
121      ctttcttttt cttcttccct ccctatctaa ccctcccatg gcaccttcag actttgcttc      3360
122      ccattgtggc tcctatctgt gttttgaatg gtgttgtatg cctttaaatc tgtgatgatc      3420
123      ctcatatggc ccagtgtcaa gttgtgcttg tttacagcac tactctgtgc cagccacaca      3480
124      aacgtttact tatcttatgc cacgggaagt ttagagagct aagattatct ggggaaatca      3540
125      aaacaaaaaa caagcaaaca aaaaaaaaa                                        3569