bp_process_wormbase: move program to new Bio-DB-Ace distribution
[bioperl-live.git] / t / data / ssp160.embl.1
blob4ed12f821a4fc289eb4bc46ca2f9cb7fb6e97b9e
1 ID   AF036895   standard; DNA; INV; 3693 BP.
2 XX
3 AC   AF036895;
4 XX
5 SV   AF036895.1
6 XX
7 DT   22-DEC-1997 (Rel. 54, Created)
8 DT   03-MAR-2000 (Rel. 62, Last updated, Version 6)
9 XX
10 DE   Chironomus thummi special lobe-specific silk protein ssp160 gene, complete
11 DE   cds.
13 KW   .
15 OS   Chironomus thummi
16 OC   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera;
17 OC   Endopterygota; Diptera; Nematocera; Chironomoidea; Chironomidae;
18 OC   Chironominae; Chironomus.
20 RN   [1]
21 RP   1-3644
22 RX   MEDLINE; 96199249.
23 RX   PUBMED; 8621663.
24 RA   Hoffman R.T., Schmidt E.R., Case S.T.;
25 RT   "A cell-specific glycosylated silk protein from Chironomus thummi salivary
26 RT   glands. Cloning, chromosomal localization, and characterization of cDNA";
27 RL   J. Biol. Chem. 271(16):9809-9815(1996).
29 RN   [2]
30 RP   1-3693
31 RX   MEDLINE; 99077856.
32 RX   PUBMED; 9858763.
33 RA   Berezikov E., Blinov A.G., Scherbik S., Cox C.K., Case S.T.;
34 RT   "Structure and polymorphism of the Chironomus thummi gene encoding special
35 RT   lobe-specific silk protein, ssp160";
36 RL   Gene 223(1-2):347-354(1998).
38 RN   [3]
39 RP   1-3693
40 RA   Berezikov E., Blinov A.G., Scherbik S.S., Cox C.C., Case S.T.;
41 RT   ;
42 RL   Submitted (05-DEC-1997) to the EMBL/GenBank/DDBJ databases.
43 RL   Biochemistry, University of Mississippi Medical Center, 2500 North State
44 RL   Street, Jackson, MS 39216-4505, USA
46 CC   On Mar 4, 1998 this sequence version replaced gi:2707296.
48 FH   Key             Location/Qualifiers
50 FT   source          1..3693
51 FT                   /chromosome="IV"
52 FT                   /db_xref="taxon:7154"
53 FT                   /organism="Chironomus thummi"
54 FT                   /strain="German"
55 FT                   /map="A2b"
56 FT                   /dev_stage="larval"
57 FT                   /cell_type="lobe-specific secretory"
58 FT                   /tissue_type="salivary gland"
59 FT   CAAT_signal     84..87
60 FT                   /gene="ssp160"
61 FT   TATA_signal     169..172
62 FT                   /gene="ssp160"
63 FT   mRNA            join(198..288,604..759,825..2408,2874..3129,3188..3241,
64 FT                   3299..3569)
65 FT                   /gene="ssp160"
66 FT                   /product="special lobe-specific silk protein ssp160"
67 FT   5'UTR           198..234
68 FT                   /gene="ssp160"
69 FT   CDS             join(235..288,604..759,825..2408,2874..3129,3188..3241,
70 FT                   3299..3441)
71 FT                   /codon_start=1
72 FT                   /db_xref="UniProt/TrEMBL:O44416"
73 FT                   /note="160 kDa secretory protein"
74 FT                   /gene="ssp160"
75 FT                   /product="special lobe-specific silk protein ssp160"
76 FT                   /protein_id="AAD11516.1"
77 FT                   /translation="MNIKVILVCALVAIFFAQVAEGGPIANFVGFIISLLFSLFEVMLS
78 FT                   VVFDVKSFTSLSNATANATMPGFASSVGGGRFTVIMKGTFNLIAMISANIQAIQSGSGS
79 FT                   ASSNSSSSANSTTSSNSTTSSNSTTSSNSTTSSNSTSSGLTTGASVVSLIDTCAWVYQD
80 FT                   SSVGIAYLMVSILALFYGQSVSAPPYADLGIPALPANTSGAGVPQSVQIKAAITYINVT
81 FT                   INFITLTGQQFEDLQGPVTTDCGCPNTTSVAPLVAEWEAIMAALEAFASGSASSNSTSN
82 FT                   STSTSNSTTTSNSTTTTNSTTSTNSTSSSNSTTIAGSIDIAANLTVALQNLQALLMQEA
83 FT                   TCAPCLAANAKKSGVREFGPCKAAGSSCARSGQRKVKRKARLEKMRAKSRRAVGNRKGS
84 FT                   MKKRVRSRAKKFGKAAKSGVRRYRKNIKFVYIPPVMASLNAYAALMASLSDSISYQSES
85 FT                   ALNSTDSACNSTSNSTDEAVINATTAVTDMFVNFTAMVINNTVAHPNCTQYADMALSMV
86 FT                   SQINEQIIACGSQSDSAQSSIYANVTISIVAMAQEYNNFASMSDKCTRSFANSWLWMYI
87 FT                   KWVFYRMGMTSGVPNFLACQTKAQSSLTAFLASFNATVSATISAASANNSEVQSSEAAC
88 FT                   IESSLAEAAVILEMFEAAYQNCTDPGSVTVPAETTTTTSTTTTTTTTTTTAAPTTTTTK
89 FT                   AANAPFTYPLCTLIMSTTCSLGGAGCTYPLISSAGCCPSGKTLNTGLGGRGCCK"
90 FT   3'UTR           3442..3569
91 FT                   /gene="ssp160"
92 FT   polyA_signal    order(3520..3523,3532..3537,3539..3544)
93 FT                   /gene="ssp160"
95 SQ   Sequence 3693 BP; 1171 A; 768 C; 633 G; 1121 T; 0 other;
96      aagctttcaa ctctcattta aacctaaata agcacatcat atccacaatt catcagccaa        60
97      taaaaattca ctttatttta atccaatcaa agaaagtttc acgatgtcaa aaacattcgt       120
98      ggatgtcccg tcaagtggaa ggagaaacga aaattcacga aatttcacaa taaaaagtga       180
99      gtaagttgtg tggtccatgt catatcgatc taatttatcg aatagtgata aaatatgaat       240
100      attaaagtga tcttagtgtg cgccttggtt gcgatcttct ttgcacaggt aagttggtaa       300
101      cttgggttgg gatcttcttt aaatttgact agctttgtac aagatatgag ttgtatagtc       360
102      tgtagttgta gtgtcatggg ttgtatactg tcttgtaggc taggttttgc ggctcttgca       420
103      caaatatatc ttaaaaagat cttaaaagtc aacgagagtg ttcaataacg tgatcaataa       480
104      caagcccatg atacgtctca gctccttaaa tccaccaaat atgactcata tacagacaca       540
105      accctaatct taaagtacta agcaatttta atcacaattt taaattttcc acatcttatc       600
106      caggttgcag aaggcggacc aatcgccaat tttgtaggct tcatcatctc cctcttgttc       660
107      tccttgtttg aagtcatgct gtcagttgtg ttcgatgtca agtcgttcac aagcttgtca       720
108      aatgccacag caaatgcaac gatgcctggt tttgcatctg tgagtatttt tagctatagc       780
109      ttgacctgca aaatccttga taaatatgtt gattccattt ctagagcgtt ggtggtggtc       840
110      gcttcacagt catcatgaaa ggaacattca atttgattgc catgatatcg gcaaatattc       900
111      aagccattca gtcaggatca ggatcagcat cgtctaattc ctcatcaagt gctaattcta       960
112      caacatcctc aaactcaaca acaagctcaa actcaacgac atcctcgaac tcaacaacaa      1020
113      gctcaaactc tacatccagt ggattaacaa ccggtgctag cgttgtaagc ttgattgata      1080
114      cctgtgcttg ggtctatcag gacagttcag ttggaattgc ctacttgatg gtctcaattt      1140
115      tggcactttt ctatggacaa tctgtctcag caccgccata tgctgatctt ggtataccag      1200
116      ctctaccagc aaatacctct ggtgctggag ttccacaatc tgtacaaatt aaagcagcaa      1260
117      ttacttacat caatgttact attaacttta ttaccttaac tggtcaacaa tttgaagatt      1320
118      tacaaggtcc agttaccaca gattgtggat gtccaaatac aactagtgtt gcgccacttg      1380
119      ttgctgaatg ggaagccata atggctgctc ttgaagcttt cgctagtgga tcagcatcat      1440
120      ctaattctac atctaattca acatcaacaa gtaactcaac aacgacaagc aactcaacaa      1500
121      ctacgacaaa ttcaacaact tcaactaatt caacatcctc gtcaaattcg acaacaattg      1560
122      ctggatctat tgacattgct gctaatctta cagttgccct ccagaacctc caagccttgc      1620
123      tcatgcaaga agctacttgt gctccatgcc tagctgcaaa tgccaaaaag agtggtgttc      1680
124      gtgaatttgg accatgtaaa gctgctggct catcatgtgc tagatcagga caaagaaaag      1740
125      tcaagcgtaa ggcacgattg gagaagatgc gtgccaagtc ccgtcgtgca gtcggtaaca      1800
126      gaaaaggatc aatgaagaag cgcgtccgta gtcgtgcaaa gaaattcgga aaggctgcaa      1860
127      agtcaggagt tagacgatac cgcaagaaca tcaagtttgt ctacattcca ccagtcatgg      1920
128      cttcacttaa tgcatatgca gcattgatgg catctttaag tgacagcatc tcatatcaat      1980
129      ctgaatcggc tttgaactca acagactctg catgtaactc aacatcaaac agcacagatg      2040
130      aggctgtaat taatgcaaca accgctgtta ctgatatgtt tgtcaacttt actgctatgg      2100
131      tcatcaataa tactgttgca catccaaatt gtactcaata tgctgacatg gctctttcaa      2160
132      tggtctctca aatcaacgag caaatcattg catgcggaag tcagtctgat tctgctcagt      2220
133      catcaatcta tgcaaatgtt acaatcagta ttgttgcaat ggctcaagaa tacaataact      2280
134      ttgcatctat gtctgataag tgtaccagat catttgccaa tagttggttg tggatgtaca      2340
135      ttaagtgggt cttctatcga atgggaatga cttctggagt tcctaacttc ctcgcttgtc      2400
136      aaactaaggt ttgtgattta cttaacaaat acttgaaact aaacgtatcc cttagaactg      2460
137      aacttatcat tagaaattga acttatcctt taaaaactga acttatcccg agaaaagaaa      2520
138      tgtatcctta gaaacgaaat cggttttaaa aactgagctt attcttcagg aactaaactc      2580
139      atccttagaa actgaccata tccttaaaaa ctgaacgtat tcttagaagc taactcatta      2640
140      ttcagaaact gaacttgacc ttagaaactg aacatattct tcggactaaa ctcatcctaa      2700
141      gaaactgacc gtatccttaa aaactgaact tagaagctga actcattatt cagaaactga      2760
142      agttcaccct tagaaactga acttattctt caggaactaa acttatcctt tgaaactgaa      2820
143      cttatcctta aaaactgatt ttactgagtc cttctttaat ccttcattaa taggctcaaa      2880
144      gcagtcttac agcattcttg gcatcattta atgccacagt cagtgccacg atttcagcag      2940
145      caagtgcaaa taattctgaa gttcaaagct ctgaagcagc ttgtattgaa agtagtcttg      3000
146      cggaagcagc cgttatttta gaaatgtttg aggcagcata tcaaaactgt acagatccag      3060
147      gatccgtaac agttccagca gagactacaa caacgaccag tacaaccacc actacaacta      3120
148      ccacaacaag taggttaaaa ttggaaaagt ttagaatttt gtgtgcaatt tttttaattt      3180
149      tttacagcaa ccgcagcacc aacaacaacc acaactaagg ctgctaatgc accattcaca      3240
150      tgtaagatat gaaatcaaat tgtgactttt tctaagaaat tgtttccttt ttttctagat      3300
151      ccattgtgta ctttgatcat gtcaacaaca tgctcactgg gtggagcagg atgtacatat      3360
152      ccacttatct catctgctgg ctgctgtcca tctggcaaaa cattaaacac tggtctcggt      3420
153      ggacgtggtt gttgcaaata aaatctacag cgacagttaa attgaagcaa ttattttttc      3480
154      ctatttcttg atgtagaaca ttttttgtac ttaattttga taaaatgtgg cattaaacat      3540
155      ataatctgaa atgtggacga gaaactttat tttaaactat ttatttattt tttaatcttt      3600
156      tcagaaactc aatttatccc ataggaactg aacttatcct taataaactg gtcttatctt      3660
157      aagcaacaaa acgttttctt ttcaactgaa ttc                                   3693