Bio::DB::TFBS namespace has been moved to its own distribution named after itself
[bioperl-live.git] / t / data / ecolitst.bls
blobb44d8820e69e70ae35dfaf65742056b7b5f74415
1 BLASTP 2.1.3 [Apr-11-2001]
4 Reference: Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer, 
5 Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), 
6 "Gapped BLAST and PSI-BLAST: a new generation of protein database search
7 programs",  Nucleic Acids Res. 25:3389-3402.
9 Query= gi|1786183|gb|AAC73113.1| (AE000111) aspartokinase I,
10 homoserine dehydrogenase I [Escherichia coli]
11          (820 letters)
13 Database: ecoli.aa
14            4289 sequences; 1,358,990 total letters
16 Searching..................................................done
18                                                                    Score     E
19 Sequences producing significant alignments:                        (bits)  Value
21 gb|AAC73113.1| (AE000111) aspartokinase I, homoserine dehydrogen...  1567  0.0
22 gb|AAC76922.1| (AE000468) aspartokinase II and homoserine dehydr...   332  1e-91
23 gb|AAC76994.1| (AE000475) aspartokinase III, lysine sensitive [E...   184  3e-47
24 gb|AAC73282.1| (AE000126) uridylate kinase [Escherichia coli]          42  3e-04
26 >gb|AAC73113.1| (AE000111) aspartokinase I, homoserine dehydrogenase I [Escherichia
27            coli]
28           Length = 820
30  Score = 1567 bits (4058), Expect = 0.0
31  Identities = 806/820 (98%), Positives = 806/820 (98%)
33 Query: 1   MRVLKFGGTSVANAERFLRVADILESNARQGQVATVLSAPAKITNHLVAMIEKTISGQDA 60
34            MRVLKFGGTSVANAERFLRVADILESNARQGQVATVLSAPAKITNHLVAMIEKTISGQDA
35 Sbjct: 1   MRVLKFGGTSVANAERFLRVADILESNARQGQVATVLSAPAKITNHLVAMIEKTISGQDA 60
37 Query: 61  LPNISDAERIFAELLTGLAAAQPGFPLAQLKTFVDQEFAQIKHVLHGISLLGQCPDSINA 120
38            LPNISDAERIFAELLTGLAAAQPGFPLAQLKTFVDQEFAQIKHVLHGISLLGQCPDSINA
39 Sbjct: 61  LPNISDAERIFAELLTGLAAAQPGFPLAQLKTFVDQEFAQIKHVLHGISLLGQCPDSINA 120
41 Query: 121 ALICRGEKMSIAIMAGVLEARGHNVTVIDPVEKLLAVGHYLESTVDIAESTRRIAASRIP 180
42            ALICRGEKMSIAIMAGVLEARGHNVTVIDPVEKLLAVGHYLESTVDIAESTRRIAASRIP
43 Sbjct: 121 ALICRGEKMSIAIMAGVLEARGHNVTVIDPVEKLLAVGHYLESTVDIAESTRRIAASRIP 180
45 Query: 181 ADHMVLMAGFTAGNEKGELVVLGRNGSDYSAAVLAACLRADCCEIWTDVDGVYTCDPRQV 240
46            ADHMVLMAGFTAGNEKGELVVLGRNGSDYSAAVLAACLRADCCEIWTDVDGVYTCDPRQV
47 Sbjct: 181 ADHMVLMAGFTAGNEKGELVVLGRNGSDYSAAVLAACLRADCCEIWTDVDGVYTCDPRQV 240
49 Query: 241 PDARLLKSMSYQEAMELSYFGAKVLHPRTITPIAQFQIPCLIKNTGNPQAPGTLIGASRD 300
50            PDARLLKSMSYQEAMELSYFGAKVLHPRTITPIAQFQIPCLIKNTGNPQAPGTLIGASRD
51 Sbjct: 241 PDARLLKSMSYQEAMELSYFGAKVLHPRTITPIAQFQIPCLIKNTGNPQAPGTLIGASRD 300
53 Query: 301 EDELPVKGISNLNNMAMFSVSGPGMKGMVGMAARVFAAMSRARISVVLITQSSSEYSISF 360
54            EDELPVKGISNLNNMAMFSVSGPGMKGMVGMAARVFAAMSRARISVVLITQSSSEYSISF
55 Sbjct: 301 EDELPVKGISNLNNMAMFSVSGPGMKGMVGMAARVFAAMSRARISVVLITQSSSEYSISF 360
57 Query: 361 CVPQSDCVRAERAMQEEFYLELKEGLLEPLAVTERLAIISVVGDGMRTLRGISAKFFAAL 420
58            CVPQSDCVRAERAMQEEFYLELKEGLLEPLAVTERLAIISVVGDGMRTLRGISAKFFAAL
59 Sbjct: 361 CVPQSDCVRAERAMQEEFYLELKEGLLEPLAVTERLAIISVVGDGMRTLRGISAKFFAAL 420
61 Query: 421 ARANINIVAIAQGSSERSISVVVNNDDATTGVRVTHQMLFNTDQXXXXXXXXXXXXXXAL 480
62            ARANINIVAIAQGSSERSISVVVNNDDATTGVRVTHQMLFNTDQ              AL
63 Sbjct: 421 ARANINIVAIAQGSSERSISVVVNNDDATTGVRVTHQMLFNTDQVIEVFVIGVGGVGGAL 480
65 Query: 481 LEQLKRQQSWLKNKHIDLRVCGVANSKALLTNVHGLNLENWQEELAQAKEPFNLGRLIRL 540
66            LEQLKRQQSWLKNKHIDLRVCGVANSKALLTNVHGLNLENWQEELAQAKEPFNLGRLIRL
67 Sbjct: 481 LEQLKRQQSWLKNKHIDLRVCGVANSKALLTNVHGLNLENWQEELAQAKEPFNLGRLIRL 540
69 Query: 541 VKEYHLLNPVIVDCTSSQAVADQYADFLREGFHVVTPNKKANTSSMDYYHQLRYAAEKSR 600
70            VKEYHLLNPVIVDCTSSQAVADQYADFLREGFHVVTPNKKANTSSMDYYHQLRYAAEKSR
71 Sbjct: 541 VKEYHLLNPVIVDCTSSQAVADQYADFLREGFHVVTPNKKANTSSMDYYHQLRYAAEKSR 600
73 Query: 601 RKFLYDTNVGAGLPVIENLQNLLNAGDELMKFSGILSGSLSYIFGKLDEGMSFSEATTLA 660
74            RKFLYDTNVGAGLPVIENLQNLLNAGDELMKFSGILSGSLSYIFGKLDEGMSFSEATTLA
75 Sbjct: 601 RKFLYDTNVGAGLPVIENLQNLLNAGDELMKFSGILSGSLSYIFGKLDEGMSFSEATTLA 660
77 Query: 661 REMGYTEPDPRDDLSGMDVARKLLILARETGRELELADIEIEPVLPAEFNAEGDVAAFMA 720
78            REMGYTEPDPRDDLSGMDVARKLLILARETGRELELADIEIEPVLPAEFNAEGDVAAFMA
79 Sbjct: 661 REMGYTEPDPRDDLSGMDVARKLLILARETGRELELADIEIEPVLPAEFNAEGDVAAFMA 720
81 Query: 721 NLSQLDDLFAARVAKARDEGKVLRYVGNIDEDGVCRVKIAEVDGNDPLFKVKNGENALAF 780
82            NLSQLDDLFAARVAKARDEGKVLRYVGNIDEDGVCRVKIAEVDGNDPLFKVKNGENALAF
83 Sbjct: 721 NLSQLDDLFAARVAKARDEGKVLRYVGNIDEDGVCRVKIAEVDGNDPLFKVKNGENALAF 780
85 Query: 781 YSHYYQPLPLVLRGYGAGNDVTAAGVFADLLRTLSWKLGV 820
86            YSHYYQPLPLVLRGYGAGNDVTAAGVFADLLRTLSWKLGV
87 Sbjct: 781 YSHYYQPLPLVLRGYGAGNDVTAAGVFADLLRTLSWKLGV 820
90 >gb|AAC76922.1| (AE000468) aspartokinase II and homoserine dehydrogenase II
91            [Escherichia coli]
92           Length = 810
94  Score =  332 bits (850), Expect = 1e-91
95  Identities = 243/821 (29%), Positives = 403/821 (48%), Gaps = 44/821 (5%)
97 Query: 5   KFGGTSVANAERFLRVADILESNARQGQVATVLSAPAKITNHLVAMIEKTISGQDALPNI 64
98            KFGG+S+A+ + +LRVA I+   ++   +  V+SA    TN L+  ++ + + + +   +
99 Sbjct: 16  KFGGSSLADVKCYLRVAGIMAEYSQPDDMM-VVSAAGSTTNQLINWLKLSQTDRLSAHQV 74
101 Query: 65  SDAERIF-AELLTGLAAAQPGFPLAQLKTFVDQEFAQIKHVLHGISLLGQCPDSINAALI 123
102                R +  +L++GL  A+    L  +  FV         +  GI+      D++ A ++
103 Sbjct: 75  QQTLRRYQCDLISGLLPAEEADSL--ISAFVSDLERLAALLDSGIN------DAVYAEVV 126
105 Query: 124 CRGEKMSIAIMAGVLEARGHNVTVIDPVEKLLAVGHYLESTVDIAESTRRIAASRIPADH 183
106              GE  S  +M+ VL  +G     +D  E L A      +   + E        ++   H
107 Sbjct: 127 GHGEVWSARLMSAVLNQQGLPAAWLDAREFLRAER---AAQPQVDEGLSYPLLQQLLVQH 183
109 Query: 184 ---MVLMAGFTAGNEKGELVVLGRNGSDYSAAVLAACLRADCCEIWTDVDGVYTCDPRQV 240
110                +++ GF + N  GE V+LGRNGSDYSA  + A        IW+DV GVY+ DPR+V
111 Sbjct: 184 PGKRLVVTGFISRNNAGETVLLGRNGSDYSATQIGALAGVSRVTIWSDVAGVYSADPRKV 243
113 Query: 241 PDARLLKSMSYQEAMELSYFGAKVLHPRTITPIAQFQIPCLIKNTGNPQAPGTLIGASRD 300
114             DA LL  +   EA EL+   A VLH RT+ P++  +I   ++ +  P       G++R 
115 Sbjct: 244 KDACLLPLLRLDEASELARLAAPVLHARTLQPVSGSEIDLQLRCSYTPDQ-----GSTRI 298
117 Query: 301 EDELP----VKGISNLNNMAMFSVSGPGMKGMVGMAARVFAAMSRARISVVLITQSSSEY 356
118            E  L      + +++ +++ +     P  +        +   + RA++  + +   +   
119 Sbjct: 299 ERVLASGTGARIVTSHDDVCLIEFQVPASQDFKLAHKEIDQILKRAQVRPLAVGVHNDRQ 358
121 Query: 357 SISFCVPQSDCVRAERAMQEEFYLELKEGLLEPLAVTERLAIISVVGDGMRTLRGISAKF 416
122             + FC        A + + E        GL   L + + LA++++VG G+        +F
123 Sbjct: 359 LLQFCYTSEVADSALKILDEA-------GLPGELRLRQGLALVAMVGAGVTRNPLHCHRF 411
125 Query: 417 FAALARANINIVAIAQGSSERSISVVVNNDDATTGVRVTHQMLFNTDQXXXXXXXXXXXX 476
126            +  L    +      Q     S+  V+      + ++  HQ +F  ++            
127 Sbjct: 412 WQQLKGQPVEFTW--QSDDGISLVAVLRTGPTESLIQGLHQSVFRAEKRIGLVLFGKGNI 469
129 Query: 477 XXALLEQLKRQQSWLKNKH-IDLRVCGVANSKALLTNVHGLN----LENWQEELAQAKEP 531
130                LE   R+QS L  +   +  + GV +S+  L +  GL+    L  + +E  +  E 
131 Sbjct: 470 GSRWLELFAREQSTLSARTGFEFVLAGVVDSRRSLLSYDGLDASRALAFFNDEAVEQDEE 529
133 Query: 532 FNLGRLIRLVKEYHLLNPVIVDCTSSQAVADQYADFLREGFHVVTPNKKANTSSMDYYHQ 591
134                 L   ++ +   + V++D T+SQ +ADQY DF   GFHV++ NK A  S  + Y Q
135 Sbjct: 530 ----SLFLWMRAHPYDDLVVLDVTASQQLADQYLDFASHGFHVISANKLAGASDSNKYRQ 585
137 Query: 592 LRYAAEKSRRKFLYDTNVGAGLPVIENLQNLLNAGDELMKFSGILSGSLSYIFGKLDEGM 651
138            +  A EK+ R +LY+  VGAGLP+   +++L+++GD ++  SGI SG+LS++F + D  +
139 Sbjct: 586 IHDAFEKTGRHWLYNATVGAGLPINHTVRDLIDSGDTILSISGIFSGTLSWLFLQFDGSV 645
141 Query: 652 SFSEATTLAREMGYTEPDPRDDLSGMDVARKLLILARETGRELELADIEIEPVLPAEFNA 711
142             F+E    A + G TEPDPRDDLSG DV RKL+ILARE G  +E   + +E ++PA    
143 Sbjct: 646 PFTELVDQAWQQGLTEPDPRDDLSGKDVMRKLVILAREAGYNIEPDQVRVESLVPAHCEG 705
145 Query: 712 EGDVAAFMANLSQLDDLFAARVAKARDEGKVLRYVGNIDEDGVCRVKIAEVDGNDPLFKV 771
146             G +  F  N  +L++    R+  AR+ G VLRYV   D +G  RV +  V  + PL  +
147 Sbjct: 706 -GSIDHFFENGDELNEQMVQRLEAAREMGLVLRYVARFDANGKARVGVEAVREDHPLASL 764
149 Query: 772 KNGENALAFYSHYYQPLPLVLRGYGAGNDVTAAGVFADLLR 812
150               +N  A  S +Y+  PLV+RG GAG DVTA  + +D+ R
151 Sbjct: 765 LPCDNVFAIESRWYRDNPLVIRGPGAGRDVTAGAIQSDINR 805
154 >gb|AAC76994.1| (AE000475) aspartokinase III, lysine sensitive [Escherichia coli]
155           Length = 449
157  Score =  184 bits (467), Expect = 3e-47
158  Identities = 142/471 (30%), Positives = 228/471 (48%), Gaps = 41/471 (8%)
160 Query: 3   VLKFGGTSVANAERFLRVADILESNARQGQVATVLSAPAKITNHLVAMIEKTISGQ---- 58
161            V KFGGTSVA+ +   R ADI+ S+A    V  VLSA A ITN LVA+ E    G+    
162 Sbjct: 6   VSKFGGTSVADFDAMNRSADIVLSDANVRLV--VLSASAGITNLLVALAEGLEPGERFEK 63
164 Query: 59  -DALPNISDAERIFAELLTGLAAAQPGFPLAQLKTFVDQEFAQIKHVLHGISLLGQCP-- 115
165             DA+ NI                    F + +   + +    +I+ +L  I++L +    
166 Sbjct: 64  LDAIRNIQ-------------------FAILERLRYPNVIREEIERLLENITVLAEAAAL 104
168 Query: 116 ---DSINAALICRGEKMSIAIMAGVLEARGHNVTVIDPVEKLLAVGHYLESTVDIAESTR 172
169                ++   L+  GE MS  +   +L  R       D  + +     +  +  DIA    
170 Sbjct: 105 ATSPALTDELVSHGELMSTLLFVEILRERDVQAQWFDVRKVMRTNDRFGRAEPDIAALAE 164
172 Query: 173 RIAASRIPA--DHMVLMAGFTAGNEKGELVVLGRNGSDYSAAVLAACLRADCCEIWTDVD 230
173              A   +P   + +V+  GF     KG    LGR GSDY+AA+LA  L A   +IWTDV 
174 Sbjct: 165 LAALQLLPRLNEGLVITQGFIGSENKGRTTTLGRGGSDYTAALLAEALHASRVDIWTDVP 224
176 Query: 231 GVYTCDPRQVPDARLLKSMSYQEAMELSYFGAKVLHPRTITPIAQFQIPCLIKNTGNPQA 290
177            G+YT DPR V  A+ +  +++ EA E++ FGAKVLHP T+ P  +  IP  + ++ +P+A
178 Sbjct: 225 GIYTTDPRVVSAAKRIDEIAFAEAAEMATFGAKVLHPATLLPAVRSDIPVFVGSSKDPRA 284
180 Query: 291 PGTLIGASRDEDELPVKGISNLNNMAMFSVSGPGMKGMVGMAARVFAAMSRARISVVLIT 350
181             GTL+  ++ E+    + ++   N  + ++    M    G  A VF  ++R  ISV LIT
182 Sbjct: 285 GGTLV-CNKTENPPLFRALALRRNQTLLTLHSLNMLHSRGFLAEVFGILARHNISVDLIT 343
184 Query: 351 QSSSEYSISFCVPQSDCV-RAERAMQEEFYLELKEGLLEPLAVTERLAIISVVGDGMRTL 409
185              +SE S++  +  +      +  + +   +EL    L  + V E LA+++++G+ +   
186 Sbjct: 344 --TSEVSVALTLDTTGSTSTGDTLLTQSLLMEL--SALCRVEVEEGLALVALIGNDLSKA 399
188 Query: 410 RGISAKFFAALARANINIVAIAQGSSERSISVVVNNDDATTGVRVTHQMLF 460
189             G+  + F  L   NI +  I  G+S  ++  +V  +DA   V+  H  LF
190 Sbjct: 400 CGVGKEVFGVLEPFNIRM--ICYGASSHNLCFLVPGEDAEQVVQKLHSNLF 448
193 >gb|AAC73282.1| (AE000126) uridylate kinase [Escherichia coli]
194           Length = 241
196  Score = 41.6 bits (96), Expect = 3e-04
197  Identities = 28/97 (28%), Positives = 44/97 (44%), Gaps = 8/97 (8%)
199 Query: 199 LVVLGRNGSDYSAAVLAACLR-----ADCCEIWTDVDGVYTCDPRQVPDARLLKSMSYQE 253
200            +++    G+ +     AACLR     AD     T VDGV+T DP + P A + + ++Y E
201 Sbjct: 132 VILSAGTGNPFFTTDSAACLRGIEIEADVVLKATKVDGVFTADPAKDPTATMYEQLTYSE 191
203 Query: 254 AMELSYFGAKVLHPRTITPIAQFQIPCLIKNTGNPQA 290
204             +E      KV+     T     ++P  + N   P A
205 Sbjct: 192 VLEKE---LKVMDLAAFTLARDHKLPIRVFNMNKPGA 225
208   Database: ecoli.aa
209     Posted date:  Dec 6, 2001  1:58 PM
210   Number of letters in database: 1,358,990
211   Number of sequences in database:  4289
212   
213 Lambda     K      H
214    0.319    0.135    0.383 
216 Gapped
217 Lambda     K      H
218    0.267   0.0410    0.140 
221 Matrix: BLOSUM62
222 Gap Penalties: Existence: 11, Extension: 1
223 Number of Hits to DB: 2022122
224 Number of Sequences: 4289
225 Number of extensions: 82424
226 Number of successful extensions: 256
227 Number of sequences better than 1.0e-03: 4
228 Number of HSP's better than  0.0 without gapping: 3
229 Number of HSP's successfully gapped in prelim test: 1
230 Number of HSP's that attempted gapping in prelim test: 243
231 Number of HSP's gapped (non-prelim): 4
232 length of query: 820
233 length of database: 1,358,990
234 effective HSP length: 47
235 effective length of query: 773
236 effective length of database: 1,157,407
237 effective search space: 894675611
238 effective search space used: 894675611
239 T: 11
240 A: 40
241 X1: 16 ( 7.4 bits)
242 X2: 38 (14.6 bits)
243 X3: 64 (24.7 bits)
244 S1: 41 (21.8 bits)
245 S2: 92 (40.0 bits)