Bio::DB::TFBS namespace has been moved to its own distribution named after itself
[bioperl-live.git] / t / data / testaln.stockholm
blob1d97cb4c8e535c87e8fa0c259d7ff32cd9555d74
1 # STOCKHOLM 1.0
2 #=GF ID   14-3-3
3 #=GF AC   PF00244
4 #=GF DE   14-3-3 proteins
5 #=GF AU   Finn RD
6 #=GF AL   Clustalw
7 #=GF SE   Prosite
8 #=GF GA   25 25
9 #=GF TC   35.40 35.40
10 #=GF NC   8.80 8.80
11 #=GF BM   hmmbuild -f HMM SEED
12 #=GF BM   hmmcalibrate --seed 0 HMM
13 #=GF RN   [1]
14 #=GF RM   95327195
15 #=GF RT   Structure of a 14-3-3 protein and implications for
16 #=GF RT   coordination of multiple signalling pathways. 
17 #=GF RA   Xiao B, Smerdon SJ, Jones DH, Dodson GG, Soneji Y, Aitken
18 #=GF RA   A, Gamblin SJ; 
19 #=GF RL   Nature 1995;376:188-191.
20 #=GF RN   [2]
21 #=GF RM   95327196
22 #=GF RT   Crystal structure of the zeta isoform of the 14-3-3
23 #=GF RT   protein. 
24 #=GF RA   Liu D, Bienkowska J, Petosa C, Collier RJ, Fu H, Liddington
25 #=GF RA   R; 
26 #=GF RL   Nature 1995;376:191-194.
27 #=GF RN   [3]
28 #=GF RM   96182649
29 #=GF RT   Interaction of 14-3-3 with signaling proteins is mediated
30 #=GF RT   by the recognition of phosphoserine. 
31 #=GF RA   Muslin AJ, Tanner JW, Allen PM, Shaw AS; 
32 #=GF RL   Cell 1996;84:889-897.
33 #=GF RN   [4]
34 #=GF RM   97424374
35 #=GF RT   The 14-3-3 protein binds its target proteins with a common
36 #=GF RT   site located towards the C-terminus. 
37 #=GF RA   Ichimura T, Ito M, Itagaki C, Takahashi M, Horigome T,
38 #=GF RA   Omata S, Ohno S, Isobe T 
39 #=GF RL   FEBS Lett 1997;413:273-276.
40 #=GF RN   [5]
41 #=GF RM   96394689
42 #=GF RT   Molecular evolution of the 14-3-3 protein family. 
43 #=GF RA   Wang W, Shakes DC 
44 #=GF RL   J Mol Evol 1996;43:384-398.
45 #=GF RN   [6]
46 #=GF RM   96300316
47 #=GF RT   Function of 14-3-3 proteins. 
48 #=GF RA   Jin DY, Lyu MS, Kozak CA, Jeang KT 
49 #=GF RL   Nature 1996;382:308-308.
50 #=GF DR   PROSITE; PDOC00633;
51 #=GF DR   SMART; 14_3_3;
52 #=GF DR   PRINTS; PR00305;
53 #=GF DR   SCOP; 1a4o; fa;
54 #=GF DR   INTERPRO; IPR000308;
55 #=GF SQ   16
56 #=GS 1433_LYCES/9-246  AC P93209
57 #=GS 1431_ENTHI/4-239  AC P42648
58 #=GS 1432_ENTHI/4-238  AC P42649
59 #=GS 1434_LYCES/6-243  AC P42652
60 #=GS 143B_VICFA/7-242  AC P42654
61 #=GS 1433_CAEEL/5-237  AC P41932
62 #=GS 143Z_DROME/6-239  AC P29310
63 #=GS 1433_XENLA/1-227  AC P29309
64 #=GS 143E_HUMAN/4-239  AC P42655
65 #=GS 143F_MOUSE/3-240  AC P11576
66 #=GS 143R_ARATH/7-245  AC P42647
67 #=GS 143S_HUMAN/3-238  AC P31947
68 #=GS 143T_HUMAN/3-236  AC P27348
69 #=GS BMH1_YEAST/4-240  AC P29311
70 #=GS RA24_SCHPO/6-241  AC P42656
71 #=GS RA25_SCHPO/5-240  AC P42657
72 1433_LYCES/9-246             REENVYMAKLADRAESDEEMVEFMEKVSNSLGS.EELTVEERNLLSVAYKNVIGARRASWRIISSIEQKEESRG.NEEHVNSIREYRSKIENELSKICDGILKLLDSKLIPSA..TSGDSKVFYLKMKGDYHRYLAEFKTGAERKEAAESTLTAYKAAQDIASAELAPTHPIRLGLALNFSVFYYEILNSPDRACNLAKQAFDEAIAELDTLGEESYKDSTLIMQLLRDNLTLWTSDMQDDG
73 1434_LYCES/6-243             REENVYLAKLAEQAERYEEMIEFMEKVAKTADV.EELTVEERNLLSVAYKNVIGARRASWRIISSIEQKEESRG.NEDHVNTIKEYRSKIEADLSKICDGILSLLESNLIPSA..STAESKVFHLKMKGDYHRYLAEFKTGTERKEAAENTLLAYKSAQDIALAELAPTHPIRLGLALNFSVFYYEILNSPDRACNLAKQAFDEAISELDTLGEESYKDSTLIMQLLRDNLTLWTSDNADDV
74 143R_ARATH/7-245             RDQYVYMAKLAEQAERYEEMVQFMEQLVTGATPAEELTVEERNLLSVAYKNVIGSLRAAWRIVSSIEQKEESRK.NDEHVSLVKDYRSKVESELSSVCSGILKLLDSHLIPSA..GASESKVFYLKMKGDYHRYMAEFKSGDERKTAAEDTMLAYKAAQDIAAADMAPTHPIRLGLALNFSVFYYEILNSSDKACNMAKQAFEEAIAELDTLGEESYKDSTLIMQLLRDNLTLWTSDYAGAD
75 143B_VICFA/7-242             RENFVYIAKLAEQAERYEEMVDSMKNVANLDV...ELTIEERNLLSVGYKNVIGARRASWRILSSIEQKEESKG.NDVNAKRIKEYRHKVETELSNICIDVMRVIDEHLIPSA..AAGESTVFYYKMKGDYYRYLAEFKTGNEKKEAGDQSMKAYESATTAAEAELPPTHPIRLGLALNFSVFYYEILNSPERACHLAKQAFDEAISELDTLNEESYKDSTLIMQLLRDNLTLWTSDIPEDG
76 143E_HUMAN/4-239             REDLVYQAKLAEQAERYDEMVESMKKVAGMDV...ELTVEERNLLSVAYKNVIGARRASWRIISSIEQKEENKG.GEDKLKMIREYRQMVETELKLICCDILDVLDKHLIPAA..NTGESKVFYYKMKGDYHRYLAEFATGNDRKEAAENSLVAYKAASDIAMTELPPTHPIRLGLALNFSVFYYEILNSPDRACRLAKAAFDDAIAELDTLSEESYKDSTLIMQLLRDNLTLWTSDMQGDG
77 BMH1_YEAST/4-240             REDSVYLAKLAEQAERYEEMVENMKTVASSGQ...ELSVEERNLLSVAYKNVIGARRASWRIVSSIEQKEESKEKSEHQVELICSYRSKIETELTKISDDILSVLDSHLIPSA..TTGESKVFYYKMKGDYHRYLAEFSSGDAREKATNASLEAYKTASEIATTELPPTHPIRLGLALNFSVFYYEIQNSPDKACHLAKQAFDDAIAELDTLSEESYKDSTLIMQLLRDNLTLWTSDMSESG
78 RA24_SCHPO/6-241             REDAVYLAKLAEQAERYEGMVENMKSVASTDQ...ELTVEERNLLSVAYKNVIGARRASWRIVSSIEQKEESKG.NTAQVELIKEYRQKIEQELDTICQDILTVLEKHLIPNA..ASAESKVFYYKMKGDYYRYLAEFAVGEKRQHSADQSLEGYKAASEIATAELAPTHPIRLGLALNFSVFYYEILNSPDRACYLAKQAFDEAISELDSLSEESYKDSTLIMQLLRDNLTLWTSDAEYSA
79 RA25_SCHPO/5-240             RENSVYLAKLAEQAERYEEMVENMKKVACSND...KLSVEERNLLSVAYKNIIGARRASWRIISSIEQKEESRG.NTRQAALIKEYRKKIEDELSDICHDVLSVLEKHLIPAA..TTGESKVFYYKMKGDYYRYLAEFTVGEVCKEAADSSLEAYKAASDIAVAELPPTDPMRLGLALNFSVFYYEILDSPESACHLAKQVFDEAISELDSLSEESYKDSTLIMQLLRDNLTLWTSDAEYNQ
80 1431_ENTHI/4-239             REDCVYTAKLAEQSERYDEMVQCMKQVAEMEA...ELSIEERNLLSVAYKNVIGAKRASWRIISSLEQKEQAKG.NDKHVEIIKGYRAKIEKELSTCCDDVLKVIQENLLPKA..STSESKVFFKKMEGDYYRYFAEFTVDEKRKEVADKSLAAYTEATEISNAELAPTHPIRLGLALNFSVFYFEIMNDADKACQLAKQAFDDAIAKLDEVPENMYKDSTLIMQLLRDNLTLWTSDACDEE
81 1432_ENTHI/4-238             REDLVYLSKLAEQSERYEEMVQYMKQVAEMGT...ELSVEERNLISVAYKNVVGSRRASWRIISSLEQKEQAKG.NTQRVELIKTYRAKIEQELSQKCDDVLKIITEFLLKNS..TSIESKVFFKKMEGDYYRYYAEFTVDEKRKEVADKSLAAYQEATDTA.ASLVPTHPIRLGLALNFSVFYYQIMNDADKACQLAKEAFDEAIQKLDEVPEESYKESTLIMQLLRDNLTLWTSDMGDDE
82 1433_CAEEL/5-237             VEELVQRAKLAEQAERYDDMAAAMKKVTEQGQ...ELSNEERNLLSVAYKNVVGARRSSWRVISSIEQKTEG...SEKKQQLAKEYRVKVEQELNDICQDVLKLLDEFLIVKA..GAAESKAFYLKMKGDYYRYLAEVAS.EDRAAVVEKSQKAYQEALDIAKDKMQPTHPIRLGLALNFSVFYYEILNTPEHACQLAKQAFDDAIAELDTLNEDSYKDSTLIMQLLRDNLTLWTSDVGAED
83 143Z_DROME/6-239             KEELVQKAKLAEQSERYDDMAQAMKSVTETGV...ELSNEERNLLSVAYKNVVGARRSSWRVISSIEQKTEA...SARKQQLAREYRERVEKELREICYEVLGLLDKYLIPKA..SNPESKVFYLKMKGDYYRYLAEVATGDARNTVVDDSQTAYQDAFDISKGKMQPTHPIRLGLALNFSVFYYEILNSPDKACQLAKQAFDDAIAELDTLNEDSYKDSTLIMQLLRDNLTLWTSDTQGDE
84 1433_XENLA/1-227             .......AKLSEQAERYDDMAASMKAVTELGA...ELSNEERNLLSVAYKNVVGARRSSWRVISSIEQKTEG...NDKRQQMAREYREKVETELQDICKDVLDLLDRFLVPNA..TPPESKVFYLKMKGDYYRYLSEVASGDSKQETVASSQQAYQEAFEISKSEMQPTHPIRLGLALNFSVFYYEILNSPEKACSLAKSAFDEAIRELDTLNEESYKDSTLIMQLLRDNLTLWTSENQGEE
85 143T_HUMAN/3-236             KTELIQKAKLAEQAERYDDMATCMKAVTEQGA...ELSNEERNLLSVAYKNVVGGRRSAWRVISSIEQKTDT...SDKKLQLIKDYREKVESELRSICTTVLELLDKYLIANA..TNPESKVFYLKMKGDYFRYLAEVACGDDRKQTIDNSQGAYQEAFDISKKEMQPTHPIRLGLALNFSVFYYEILNNPELACTLAKTAFDEAIAELDTLNEDSYKDSTLIMQLLRDNLTLWTSDSAGEE
86 143F_MOUSE/3-240             REQLLQRARLAEQAERYDDMASAMKAVTELNE...PLSNEDRNLLSVAYKNVVGARRSSWRVISSIEQKTMADG.NEKKLEKVKAYREKIEKELETVCNDVLALLDKFLIKNCNDFQYESKVFYLKMKGDYYRYLAEVASGEKKNSVVEASEAAYKEAFEISKEHMQPTHPIRLGLALNFSVFYYEIQNAPEQACLLAKQAFDDAIAELDTLNEDSYKDSTLIMQLLRDNLTLWTSDQQDEE
87 143S_HUMAN/3-238             RASLIQKAKLAEQAERYEDMAAFMKGAVEKGE...ELSCEERNLLSVAYKNVVGGQRAAWRVLSSIEQKSNEEG.SEEKGPEVREYREKVETELQGVCDTVLGLLDSHLIKEA..GDAESRVFYLKMKGDYYRYLAEVATGDDKKRIIDSARSAYQEAMDISKKEMPPTNPIRLGLALNFSVFHYEIANSPEEAISLAKTTFDEAMADLHTLSEDSYKDSTLIMQLLRDNLTLWTADNAGEE
89 # STOCKHOLM 1.0
90 #=GF ID   14-3-3
91 #=GF AC   PF00245
92 #=GF DE   14-3-3 proteins
93 #=GF AU   Finn RD
94 #=GF AL   Clustalw
95 #=GF SE   Prosite
96 #=GF GA   25 25
97 #=GF TC   35.40 35.40
98 #=GF NC   8.80 8.80
99 #=GF BM   hmmbuild -f HMM SEED
100 #=GF BM   hmmcalibrate --seed 0 HMM
101 #=GF RN   [1]
102 #=GF RM   95327195
103 #=GF RT   Structure of a 14-3-3 protein and implications for
104 #=GF RT   coordination of multiple signalling pathways. 
105 #=GF RA   Xiao B, Smerdon SJ, Jones DH, Dodson GG, Soneji Y, Aitken
106 #=GF RA   A, Gamblin SJ; 
107 #=GF RL   Nature 1995;376:188-191.
108 #=GF RN   [2]
109 #=GF RM   95327196
110 #=GF RT   Crystal structure of the zeta isoform of the 14-3-3
111 #=GF RT   protein. 
112 #=GF RA   Liu D, Bienkowska J, Petosa C, Collier RJ, Fu H, Liddington
113 #=GF RA   R; 
114 #=GF RL   Nature 1995;376:191-194.
115 #=GF RN   [3]
116 #=GF RM   96182649
117 #=GF RT   Interaction of 14-3-3 with signaling proteins is mediated
118 #=GF RT   by the recognition of phosphoserine. 
119 #=GF RA   Muslin AJ, Tanner JW, Allen PM, Shaw AS; 
120 #=GF RL   Cell 1996;84:889-897.
121 #=GF RN   [4]
122 #=GF RM   97424374
123 #=GF RT   The 14-3-3 protein binds its target proteins with a common
124 #=GF RT   site located towards the C-terminus. 
125 #=GF RA   Ichimura T, Ito M, Itagaki C, Takahashi M, Horigome T,
126 #=GF RA   Omata S, Ohno S, Isobe T 
127 #=GF RL   FEBS Lett 1997;413:273-276.
128 #=GF RN   [5]
129 #=GF RM   96394689
130 #=GF RT   Molecular evolution of the 14-3-3 protein family. 
131 #=GF RA   Wang W, Shakes DC 
132 #=GF RL   J Mol Evol 1996;43:384-398.
133 #=GF RN   [6]
134 #=GF RM   96300316
135 #=GF RT   Function of 14-3-3 proteins. 
136 #=GF RA   Jin DY, Lyu MS, Kozak CA, Jeang KT 
137 #=GF RL   Nature 1996;382:308-308.
138 #=GF DR   PROSITE; PDOC00633;
139 #=GF DR   SMART; 14_3_3;
140 #=GF DR   PRINTS; PR00305;
141 #=GF DR   SCOP; 1a4o; fa;
142 #=GF DR   INTERPRO; IPR000308;
143 #=GF SQ   16
144 #=GS 1433_LYCES/9-246  AC P93209
145 #=GS 1431_ENTHI/4-239  AC P42648
146 #=GS 1432_ENTHI/4-238  AC P42649
147 #=GS 1434_LYCES/6-243  AC P42652
148 #=GS 143B_VICFA/7-242  AC P42654
149 #=GS 1433_CAEEL/5-237  AC P41932
150 #=GS 143Z_DROME/6-239  AC P29310
151 #=GS 1433_XENLA/1-227  AC P29309
152 #=GS 143E_HUMAN/4-239  AC P42655
153 #=GS 143F_MOUSE/3-240  AC P11576
154 #=GS 143R_ARATH/7-245  AC P42647
155 #=GS 143S_HUMAN/3-238  AC P31947
156 #=GS 143T_HUMAN/3-236  AC P27348
157 #=GS BMH1_YEAST/4-240  AC P29311
158 #=GS RA24_SCHPO/6-241  AC P42656
159 #=GS RA25_SCHPO/5-240  AC P42657
160 1433_LYCES/9-246             REENVYMAKLADRAESDEEMVEFMEKVSNSLGS.EELTVEERNLLSVAYKNVIGARRASWRIISSIEQKEESRG.NEEHVNSIREYRSKIENELSKICDGILKLLDSKLIPSA..TSGDSKVFYLKMKGDYHRYLAEFKTGAERKEAAESTLTAYKAAQDIASAELAPTHPIRLGLALNFSVFYYEILNSPDRACNLAKQAFDEAIAELDTLGEESYKDSTLIMQLLRDNLTLWTSDMQDDG
161 1434_LYCES/6-243             REENVYLAKLAEQAERYEEMIEFMEKVAKTADV.EELTVEERNLLSVAYKNVIGARRASWRIISSIEQKEESRG.NEDHVNTIKEYRSKIEADLSKICDGILSLLESNLIPSA..STAESKVFHLKMKGDYHRYLAEFKTGTERKEAAENTLLAYKSAQDIALAELAPTHPIRLGLALNFSVFYYEILNSPDRACNLAKQAFDEAISELDTLGEESYKDSTLIMQLLRDNLTLWTSDNADDV
162 143R_ARATH/7-245             RDQYVYMAKLAEQAERYEEMVQFMEQLVTGATPAEELTVEERNLLSVAYKNVIGSLRAAWRIVSSIEQKEESRK.NDEHVSLVKDYRSKVESELSSVCSGILKLLDSHLIPSA..GASESKVFYLKMKGDYHRYMAEFKSGDERKTAAEDTMLAYKAAQDIAAADMAPTHPIRLGLALNFSVFYYEILNSSDKACNMAKQAFEEAIAELDTLGEESYKDSTLIMQLLRDNLTLWTSDYAGAD
163 143B_VICFA/7-242             RENFVYIAKLAEQAERYEEMVDSMKNVANLDV...ELTIEERNLLSVGYKNVIGARRASWRILSSIEQKEESKG.NDVNAKRIKEYRHKVETELSNICIDVMRVIDEHLIPSA..AAGESTVFYYKMKGDYYRYLAEFKTGNEKKEAGDQSMKAYESATTAAEAELPPTHPIRLGLALNFSVFYYEILNSPERACHLAKQAFDEAISELDTLNEESYKDSTLIMQLLRDNLTLWTSDIPEDG
164 143E_HUMAN/4-239             REDLVYQAKLAEQAERYDEMVESMKKVAGMDV...ELTVEERNLLSVAYKNVIGARRASWRIISSIEQKEENKG.GEDKLKMIREYRQMVETELKLICCDILDVLDKHLIPAA..NTGESKVFYYKMKGDYHRYLAEFATGNDRKEAAENSLVAYKAASDIAMTELPPTHPIRLGLALNFSVFYYEILNSPDRACRLAKAAFDDAIAELDTLSEESYKDSTLIMQLLRDNLTLWTSDMQGDG
165 BMH1_YEAST/4-240             REDSVYLAKLAEQAERYEEMVENMKTVASSGQ...ELSVEERNLLSVAYKNVIGARRASWRIVSSIEQKEESKEKSEHQVELICSYRSKIETELTKISDDILSVLDSHLIPSA..TTGESKVFYYKMKGDYHRYLAEFSSGDAREKATNASLEAYKTASEIATTELPPTHPIRLGLALNFSVFYYEIQNSPDKACHLAKQAFDDAIAELDTLSEESYKDSTLIMQLLRDNLTLWTSDMSESG
166 RA24_SCHPO/6-241             REDAVYLAKLAEQAERYEGMVENMKSVASTDQ...ELTVEERNLLSVAYKNVIGARRASWRIVSSIEQKEESKG.NTAQVELIKEYRQKIEQELDTICQDILTVLEKHLIPNA..ASAESKVFYYKMKGDYYRYLAEFAVGEKRQHSADQSLEGYKAASEIATAELAPTHPIRLGLALNFSVFYYEILNSPDRACYLAKQAFDEAISELDSLSEESYKDSTLIMQLLRDNLTLWTSDAEYSA
167 RA25_SCHPO/5-240             RENSVYLAKLAEQAERYEEMVENMKKVACSND...KLSVEERNLLSVAYKNIIGARRASWRIISSIEQKEESRG.NTRQAALIKEYRKKIEDELSDICHDVLSVLEKHLIPAA..TTGESKVFYYKMKGDYYRYLAEFTVGEVCKEAADSSLEAYKAASDIAVAELPPTDPMRLGLALNFSVFYYEILDSPESACHLAKQVFDEAISELDSLSEESYKDSTLIMQLLRDNLTLWTSDAEYNQ
168 1431_ENTHI/4-239             REDCVYTAKLAEQSERYDEMVQCMKQVAEMEA...ELSIEERNLLSVAYKNVIGAKRASWRIISSLEQKEQAKG.NDKHVEIIKGYRAKIEKELSTCCDDVLKVIQENLLPKA..STSESKVFFKKMEGDYYRYFAEFTVDEKRKEVADKSLAAYTEATEISNAELAPTHPIRLGLALNFSVFYFEIMNDADKACQLAKQAFDDAIAKLDEVPENMYKDSTLIMQLLRDNLTLWTSDACDEE
169 1432_ENTHI/4-238             REDLVYLSKLAEQSERYEEMVQYMKQVAEMGT...ELSVEERNLISVAYKNVVGSRRASWRIISSLEQKEQAKG.NTQRVELIKTYRAKIEQELSQKCDDVLKIITEFLLKNS..TSIESKVFFKKMEGDYYRYYAEFTVDEKRKEVADKSLAAYQEATDTA.ASLVPTHPIRLGLALNFSVFYYQIMNDADKACQLAKEAFDEAIQKLDEVPEESYKESTLIMQLLRDNLTLWTSDMGDDE
170 1433_CAEEL/5-237             VEELVQRAKLAEQAERYDDMAAAMKKVTEQGQ...ELSNEERNLLSVAYKNVVGARRSSWRVISSIEQKTEG...SEKKQQLAKEYRVKVEQELNDICQDVLKLLDEFLIVKA..GAAESKAFYLKMKGDYYRYLAEVAS.EDRAAVVEKSQKAYQEALDIAKDKMQPTHPIRLGLALNFSVFYYEILNTPEHACQLAKQAFDDAIAELDTLNEDSYKDSTLIMQLLRDNLTLWTSDVGAED
171 143Z_DROME/6-239             KEELVQKAKLAEQSERYDDMAQAMKSVTETGV...ELSNEERNLLSVAYKNVVGARRSSWRVISSIEQKTEA...SARKQQLAREYRERVEKELREICYEVLGLLDKYLIPKA..SNPESKVFYLKMKGDYYRYLAEVATGDARNTVVDDSQTAYQDAFDISKGKMQPTHPIRLGLALNFSVFYYEILNSPDKACQLAKQAFDDAIAELDTLNEDSYKDSTLIMQLLRDNLTLWTSDTQGDE
172 1433_XENLA/1-227             .......AKLSEQAERYDDMAASMKAVTELGA...ELSNEERNLLSVAYKNVVGARRSSWRVISSIEQKTEG...NDKRQQMAREYREKVETELQDICKDVLDLLDRFLVPNA..TPPESKVFYLKMKGDYYRYLSEVASGDSKQETVASSQQAYQEAFEISKSEMQPTHPIRLGLALNFSVFYYEILNSPEKACSLAKSAFDEAIRELDTLNEESYKDSTLIMQLLRDNLTLWTSENQGEE
173 143T_HUMAN/3-236             KTELIQKAKLAEQAERYDDMATCMKAVTEQGA...ELSNEERNLLSVAYKNVVGGRRSAWRVISSIEQKTDT...SDKKLQLIKDYREKVESELRSICTTVLELLDKYLIANA..TNPESKVFYLKMKGDYFRYLAEVACGDDRKQTIDNSQGAYQEAFDISKKEMQPTHPIRLGLALNFSVFYYEILNNPELACTLAKTAFDEAIAELDTLNEDSYKDSTLIMQLLRDNLTLWTSDSAGEE
174 143F_MOUSE/3-240             REQLLQRARLAEQAERYDDMASAMKAVTELNE...PLSNEDRNLLSVAYKNVVGARRSSWRVISSIEQKTMADG.NEKKLEKVKAYREKIEKELETVCNDVLALLDKFLIKNCNDFQYESKVFYLKMKGDYYRYLAEVASGEKKNSVVEASEAAYKEAFEISKEHMQPTHPIRLGLALNFSVFYYEIQNAPEQACLLAKQAFDDAIAELDTLNEDSYKDSTLIMQLLRDNLTLWTSDQQDEE
175 143S_HUMAN/3-238             RASLIQKAKLAEQAERYEDMAAFMKGAVEKGE...ELSCEERNLLSVAYKNVVGGQRAAWRVLSSIEQKSNEEG.SEEKGPEVREYREKVETELQGVCDTVLGLLDSHLIKEA..GDAESRVFYLKMKGDYYRYLAEVATGDDKKRIIDSARSAYQEAMDISKKEMPPTNPIRLGLALNFSVFHYEIANSPEEAISLAKTTFDEAMADLHTLSEDSYKDSTLIMQLLRDNLTLWTADNAGEE
177 # STOCKHOLM 1.0
178 #=GF ID   14-3-3
179 #=GF AC   PF00246
180 #=GF DE   14-3-3 proteins
181 #=GF AU   Finn RD
182 #=GF AL   Clustalw
183 #=GF SE   Prosite
184 #=GF GA   25 25
185 #=GF TC   35.40 35.40
186 #=GF NC   8.80 8.80
187 #=GF BM   hmmbuild -f HMM SEED
188 #=GF BM   hmmcalibrate --seed 0 HMM
189 #=GF RN   [1]
190 #=GF RM   95327195
191 #=GF RT   Structure of a 14-3-3 protein and implications for
192 #=GF RT   coordination of multiple signalling pathways. 
193 #=GF RA   Xiao B, Smerdon SJ, Jones DH, Dodson GG, Soneji Y, Aitken
194 #=GF RA   A, Gamblin SJ; 
195 #=GF RL   Nature 1995;376:188-191.
196 #=GF RN   [2]
197 #=GF RM   95327196
198 #=GF RT   Crystal structure of the zeta isoform of the 14-3-3
199 #=GF RT   protein. 
200 #=GF RA   Liu D, Bienkowska J, Petosa C, Collier RJ, Fu H, Liddington
201 #=GF RA   R; 
202 #=GF RL   Nature 1995;376:191-194.
203 #=GF RN   [3]
204 #=GF RM   96182649
205 #=GF RT   Interaction of 14-3-3 with signaling proteins is mediated
206 #=GF RT   by the recognition of phosphoserine. 
207 #=GF RA   Muslin AJ, Tanner JW, Allen PM, Shaw AS; 
208 #=GF RL   Cell 1996;84:889-897.
209 #=GF RN   [4]
210 #=GF RM   97424374
211 #=GF RT   The 14-3-3 protein binds its target proteins with a common
212 #=GF RT   site located towards the C-terminus. 
213 #=GF RA   Ichimura T, Ito M, Itagaki C, Takahashi M, Horigome T,
214 #=GF RA   Omata S, Ohno S, Isobe T 
215 #=GF RL   FEBS Lett 1997;413:273-276.
216 #=GF RN   [5]
217 #=GF RM   96394689
218 #=GF RT   Molecular evolution of the 14-3-3 protein family. 
219 #=GF RA   Wang W, Shakes DC 
220 #=GF RL   J Mol Evol 1996;43:384-398.
221 #=GF RN   [6]
222 #=GF RM   96300316
223 #=GF RT   Function of 14-3-3 proteins. 
224 #=GF RA   Jin DY, Lyu MS, Kozak CA, Jeang KT 
225 #=GF RL   Nature 1996;382:308-308.
226 #=GF DR   PROSITE; PDOC00633;
227 #=GF DR   SMART; 14_3_3;
228 #=GF DR   PRINTS; PR00305;
229 #=GF DR   SCOP; 1a4o; fa;
230 #=GF DR   INTERPRO; IPR000308;
231 #=GF SQ   16
232 #=GS 1433_LYCES/9-246  AC P93209
233 #=GS 1431_ENTHI/4-239  AC P42648
234 #=GS 1432_ENTHI/4-238  AC P42649
235 #=GS 1434_LYCES/6-243  AC P42652
236 #=GS 143B_VICFA/7-242  AC P42654
237 #=GS 1433_CAEEL/5-237  AC P41932
238 #=GS 143Z_DROME/6-239  AC P29310
239 #=GS 1433_XENLA/1-227  AC P29309
240 #=GS 143E_HUMAN/4-239  AC P42655
241 #=GS 143F_MOUSE/3-240  AC P11576
242 #=GS 143R_ARATH/7-245  AC P42647
243 #=GS 143S_HUMAN/3-238  AC P31947
244 #=GS 143T_HUMAN/3-236  AC P27348
245 #=GS BMH1_YEAST/4-240  AC P29311
246 #=GS RA24_SCHPO/6-241  AC P42656
247 #=GS RA25_SCHPO/5-240  AC P42657
248 1433_LYCES/9-246             REENVYMAKLADRAESDEEMVEFMEKVSNSLGS.EELTVEERNLLSVAYKNVIGARRASWRIISSIEQKEESRG.NEEHVNSIREYRSKIENELSKICDGILKLLDSKLIPSA..TSGDSKVFYLKMKGDYHRYLAEFKTGAERKEAAESTLTAYKAAQDIASAELAPTHPIRLGLALNFSVFYYEILNSPDRACNLAKQAFDEAIAELDTLGEESYKDSTLIMQLLRDNLTLWTSDMQDDG
249 1434_LYCES/6-243             REENVYLAKLAEQAERYEEMIEFMEKVAKTADV.EELTVEERNLLSVAYKNVIGARRASWRIISSIEQKEESRG.NEDHVNTIKEYRSKIEADLSKICDGILSLLESNLIPSA..STAESKVFHLKMKGDYHRYLAEFKTGTERKEAAENTLLAYKSAQDIALAELAPTHPIRLGLALNFSVFYYEILNSPDRACNLAKQAFDEAISELDTLGEESYKDSTLIMQLLRDNLTLWTSDNADDV
250 143R_ARATH/7-245             RDQYVYMAKLAEQAERYEEMVQFMEQLVTGATPAEELTVEERNLLSVAYKNVIGSLRAAWRIVSSIEQKEESRK.NDEHVSLVKDYRSKVESELSSVCSGILKLLDSHLIPSA..GASESKVFYLKMKGDYHRYMAEFKSGDERKTAAEDTMLAYKAAQDIAAADMAPTHPIRLGLALNFSVFYYEILNSSDKACNMAKQAFEEAIAELDTLGEESYKDSTLIMQLLRDNLTLWTSDYAGAD
251 143B_VICFA/7-242             RENFVYIAKLAEQAERYEEMVDSMKNVANLDV...ELTIEERNLLSVGYKNVIGARRASWRILSSIEQKEESKG.NDVNAKRIKEYRHKVETELSNICIDVMRVIDEHLIPSA..AAGESTVFYYKMKGDYYRYLAEFKTGNEKKEAGDQSMKAYESATTAAEAELPPTHPIRLGLALNFSVFYYEILNSPERACHLAKQAFDEAISELDTLNEESYKDSTLIMQLLRDNLTLWTSDIPEDG
252 143E_HUMAN/4-239             REDLVYQAKLAEQAERYDEMVESMKKVAGMDV...ELTVEERNLLSVAYKNVIGARRASWRIISSIEQKEENKG.GEDKLKMIREYRQMVETELKLICCDILDVLDKHLIPAA..NTGESKVFYYKMKGDYHRYLAEFATGNDRKEAAENSLVAYKAASDIAMTELPPTHPIRLGLALNFSVFYYEILNSPDRACRLAKAAFDDAIAELDTLSEESYKDSTLIMQLLRDNLTLWTSDMQGDG
253 BMH1_YEAST/4-240             REDSVYLAKLAEQAERYEEMVENMKTVASSGQ...ELSVEERNLLSVAYKNVIGARRASWRIVSSIEQKEESKEKSEHQVELICSYRSKIETELTKISDDILSVLDSHLIPSA..TTGESKVFYYKMKGDYHRYLAEFSSGDAREKATNASLEAYKTASEIATTELPPTHPIRLGLALNFSVFYYEIQNSPDKACHLAKQAFDDAIAELDTLSEESYKDSTLIMQLLRDNLTLWTSDMSESG
254 RA24_SCHPO/6-241             REDAVYLAKLAEQAERYEGMVENMKSVASTDQ...ELTVEERNLLSVAYKNVIGARRASWRIVSSIEQKEESKG.NTAQVELIKEYRQKIEQELDTICQDILTVLEKHLIPNA..ASAESKVFYYKMKGDYYRYLAEFAVGEKRQHSADQSLEGYKAASEIATAELAPTHPIRLGLALNFSVFYYEILNSPDRACYLAKQAFDEAISELDSLSEESYKDSTLIMQLLRDNLTLWTSDAEYSA
255 RA25_SCHPO/5-240             RENSVYLAKLAEQAERYEEMVENMKKVACSND...KLSVEERNLLSVAYKNIIGARRASWRIISSIEQKEESRG.NTRQAALIKEYRKKIEDELSDICHDVLSVLEKHLIPAA..TTGESKVFYYKMKGDYYRYLAEFTVGEVCKEAADSSLEAYKAASDIAVAELPPTDPMRLGLALNFSVFYYEILDSPESACHLAKQVFDEAISELDSLSEESYKDSTLIMQLLRDNLTLWTSDAEYNQ
256 1431_ENTHI/4-239             REDCVYTAKLAEQSERYDEMVQCMKQVAEMEA...ELSIEERNLLSVAYKNVIGAKRASWRIISSLEQKEQAKG.NDKHVEIIKGYRAKIEKELSTCCDDVLKVIQENLLPKA..STSESKVFFKKMEGDYYRYFAEFTVDEKRKEVADKSLAAYTEATEISNAELAPTHPIRLGLALNFSVFYFEIMNDADKACQLAKQAFDDAIAKLDEVPENMYKDSTLIMQLLRDNLTLWTSDACDEE
257 1432_ENTHI/4-238             REDLVYLSKLAEQSERYEEMVQYMKQVAEMGT...ELSVEERNLISVAYKNVVGSRRASWRIISSLEQKEQAKG.NTQRVELIKTYRAKIEQELSQKCDDVLKIITEFLLKNS..TSIESKVFFKKMEGDYYRYYAEFTVDEKRKEVADKSLAAYQEATDTA.ASLVPTHPIRLGLALNFSVFYYQIMNDADKACQLAKEAFDEAIQKLDEVPEESYKESTLIMQLLRDNLTLWTSDMGDDE
258 1433_CAEEL/5-237             VEELVQRAKLAEQAERYDDMAAAMKKVTEQGQ...ELSNEERNLLSVAYKNVVGARRSSWRVISSIEQKTEG...SEKKQQLAKEYRVKVEQELNDICQDVLKLLDEFLIVKA..GAAESKAFYLKMKGDYYRYLAEVAS.EDRAAVVEKSQKAYQEALDIAKDKMQPTHPIRLGLALNFSVFYYEILNTPEHACQLAKQAFDDAIAELDTLNEDSYKDSTLIMQLLRDNLTLWTSDVGAED
259 143Z_DROME/6-239             KEELVQKAKLAEQSERYDDMAQAMKSVTETGV...ELSNEERNLLSVAYKNVVGARRSSWRVISSIEQKTEA...SARKQQLAREYRERVEKELREICYEVLGLLDKYLIPKA..SNPESKVFYLKMKGDYYRYLAEVATGDARNTVVDDSQTAYQDAFDISKGKMQPTHPIRLGLALNFSVFYYEILNSPDKACQLAKQAFDDAIAELDTLNEDSYKDSTLIMQLLRDNLTLWTSDTQGDE
260 1433_XENLA/1-227             .......AKLSEQAERYDDMAASMKAVTELGA...ELSNEERNLLSVAYKNVVGARRSSWRVISSIEQKTEG...NDKRQQMAREYREKVETELQDICKDVLDLLDRFLVPNA..TPPESKVFYLKMKGDYYRYLSEVASGDSKQETVASSQQAYQEAFEISKSEMQPTHPIRLGLALNFSVFYYEILNSPEKACSLAKSAFDEAIRELDTLNEESYKDSTLIMQLLRDNLTLWTSENQGEE
261 143T_HUMAN/3-236             KTELIQKAKLAEQAERYDDMATCMKAVTEQGA...ELSNEERNLLSVAYKNVVGGRRSAWRVISSIEQKTDT...SDKKLQLIKDYREKVESELRSICTTVLELLDKYLIANA..TNPESKVFYLKMKGDYFRYLAEVACGDDRKQTIDNSQGAYQEAFDISKKEMQPTHPIRLGLALNFSVFYYEILNNPELACTLAKTAFDEAIAELDTLNEDSYKDSTLIMQLLRDNLTLWTSDSAGEE
262 143F_MOUSE/3-240             REQLLQRARLAEQAERYDDMASAMKAVTELNE...PLSNEDRNLLSVAYKNVVGARRSSWRVISSIEQKTMADG.NEKKLEKVKAYREKIEKELETVCNDVLALLDKFLIKNCNDFQYESKVFYLKMKGDYYRYLAEVASGEKKNSVVEASEAAYKEAFEISKEHMQPTHPIRLGLALNFSVFYYEIQNAPEQACLLAKQAFDDAIAELDTLNEDSYKDSTLIMQLLRDNLTLWTSDQQDEE
263 143S_HUMAN/3-238             RASLIQKAKLAEQAERYEDMAAFMKGAVEKGE...ELSCEERNLLSVAYKNVVGGQRAAWRVLSSIEQKSNEEG.SEEKGPEVREYREKVETELQGVCDTVLGLLDSHLIKEA..GDAESRVFYLKMKGDYYRYLAEVATGDDKKRIIDSARSAYQEAMDISKKEMPPTNPIRLGLALNFSVFHYEIANSPEEAISLAKTTFDEAMADLHTLSEDSYKDSTLIMQLLRDNLTLWTADNAGEE