Bio::DB::TFBS namespace has been moved to its own distribution named after itself
[bioperl-live.git] / t / data / HUMBETGLOA.tblastx
blobafe7133de938fb62ffc1774941523460e86fa69f
1 TBLASTX 2.1.2 [Oct-19-2000]
4 Reference: Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer, 
5 Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), 
6 "Gapped BLAST and PSI-BLAST: a new generation of protein database search
7 programs",  Nucleic Acids Res. 25:3389-3402.
9 Query= HUMBETGLOA Human haplotype C4 beta-globin gene, complete cds. 
10          (3002 letters)
12 Database: ecoli.nt
13            400 sequences; 4,662,239 total letters
15 Searching.................................................done
17                                                                    Score     E
18 Sequences producing significant alignments:                        (bits)  Value
20 gb|AE000479.1|AE000479 Escherichia coli K-12 MG1655 section 369 ...    34  0.13
21 gb|AE000302.1|AE000302 Escherichia coli K-12 MG1655 section 192 ...    31  0.61
22 gb|AE000277.1|AE000277 Escherichia coli K-12 MG1655 section 167 ...    31  0.84
23 gb|AE000168.1|AE000168 Escherichia coli K-12 MG1655 section 58 o...    29  2.2
24 gb|AE000400.1|AE000400 Escherichia coli K-12 MG1655 section 290 ...    29  3.0
25 gb|AE000408.1|AE000408 Escherichia coli K-12 MG1655 section 298 ...    29  3.0
26 gb|AE000438.1|AE000438 Escherichia coli K-12 MG1655 section 328 ...    29  3.0
27 gb|AE000396.1|AE000396 Escherichia coli K-12 MG1655 section 286 ...    29  3.0
28 gb|AE000466.1|AE000466 Escherichia coli K-12 MG1655 section 356 ...    26  3.4
29 gb|AE000482.1|AE000482 Escherichia coli K-12 MG1655 section 372 ...    29  4.1
30 gb|AE000341.1|AE000341 Escherichia coli K-12 MG1655 section 231 ...    29  4.1
31 gb|AE000198.1|AE000198 Escherichia coli K-12 MG1655 section 88 o...    29  4.1
32 gb|AE000367.1|AE000367 Escherichia coli K-12 MG1655 section 257 ...    29  4.1
33 gb|AE000136.1|AE000136 Escherichia coli K-12 MG1655 section 26 o...    29  4.1
34 gb|AE000327.1|AE000327 Escherichia coli K-12 MG1655 section 217 ...    28  5.7
35 gb|AE000498.1|AE000498 Escherichia coli K-12 MG1655 section 388 ...    28  7.8
36 gb|AE000509.1|AE000509 Escherichia coli K-12 MG1655 section 399 ...    28  7.8
37 gb|AE000306.1|AE000306 Escherichia coli K-12 MG1655 section 196 ...    28  7.8
38 gb|AE000203.1|AE000203 Escherichia coli K-12 MG1655 section 93 o...    28  7.8
39 gb|AE000208.1|AE000208 Escherichia coli K-12 MG1655 section 98 o...    28  7.8
41 >gb|AE000479.1|AE000479 Escherichia coli K-12 MG1655 section 369 of 400 of the complete
42             genome
43           Length = 10934
45  Score = 33.6 bits (67), Expect = 0.13
46  Identities = 11/26 (42%), Positives = 16/26 (61%)
47  Frame = +1 / -2
49                                       
50 Query: 1057 SAYWSIFPPLGCWWSTLGPRGSLSPL 1134
51             +A W++FPP+G  W  L  +   SPL
52 Sbjct: 5893 AAVWALFPPVGSQWGCLASQWRTSPL 5816
55 >gb|AE000302.1|AE000302 Escherichia coli K-12 MG1655 section 192 of 400 of the complete
56             genome
57           Length = 10264
59  Score = 31.3 bits (62), Expect = 0.61
60  Identities = 8/17 (47%), Positives = 13/17 (76%)
61  Frame = +2 / +2
63                              
64 Query: 2177 WSVCWPITLAKNSPHQC 2227
65             +  CWP+ L ++SP+QC
66 Sbjct: 1157 YPACWPLPLRRSSPYQC 1207
69 >gb|AE000277.1|AE000277 Escherichia coli K-12 MG1655 section 167 of 400 of the complete
70             genome
71           Length = 11653
73  Score = 30.8 bits (61), Expect = 0.84
74  Identities = 9/25 (36%), Positives = 14/25 (56%)
75  Frame = +2 / -3
77                                      
78 Query: 2174 CWSVCWPITLAKNSPHQCRLPIRKW 2248
79             CW     + L K+ P QCR+ + +W
80 Sbjct: 4931 CWLTASVLRLQKSLPRQCRITVVRW 4857
83 >gb|AE000168.1|AE000168 Escherichia coli K-12 MG1655 section 58 of 400 of the complete genome
84           Length = 12663
86  Score = 29.5 bits (58), Expect = 2.2
87  Identities = 12/41 (29%), Positives = 24/41 (58%)
88  Frame = -1 / +1
90                                                      
91 Query: 2813 KEHFRGKVVSLSKRTEWSQG*EMQDKQMGSEKTFMRTAKTI 2691
92             K H RG+ V + ++   ++  E+ D++ G+ +   RT +TI
93 Sbjct: 13   KRHLRGE*VKVGEKYITARRGELPDQEPGNGEASYRTMRTI 135
96 >gb|AE000400.1|AE000400 Escherichia coli K-12 MG1655 section 290 of 400 of the complete
97             genome
98           Length = 14295
100  Score = 29.0 bits (57), Expect = 3.0
101  Identities = 7/18 (38%), Positives = 10/18 (54%)
102  Frame = +2 / +3
104                               
105 Query: 2165 WATCWSVCWPITLAKNSP 2218
106             W TCW+ CW      ++P
107 Sbjct: 9096 WITCWNCCWQAGWISSAP 9149
110 >gb|AE000408.1|AE000408 Escherichia coli K-12 MG1655 section 298 of 400 of the complete
111             genome
112           Length = 10944
114  Score = 29.0 bits (57), Expect = 3.0
115  Identities = 17/39 (43%), Positives = 20/39 (50%)
116  Frame = -3 / +1
118                                                    
119 Query: 1020 LSPHAQFLLVSLNLSCNLDTNLPRASPPTSSTFTLPHRA 904
120             L+  A FLLV + +S   DT LPR    T  TF    RA
121 Sbjct: 7618 LTSTAAFLLV*VKISRACDTFLPRIRSATRRTF*AEERA 7734
124 >gb|AE000438.1|AE000438 Escherichia coli K-12 MG1655 section 328 of 400 of the complete
125             genome
126           Length = 10426
128  Score = 29.0 bits (57), Expect = 3.0
129  Identities = 10/28 (35%), Positives = 12/28 (42%)
130  Frame = +2 / +3
132                                         
133 Query: 2165 WATCWSVCWPITLAKNSPHQCRLPIRKW 2248
134             WA CW  C  + +A NS    R     W
135 Sbjct: 750  WACCWRTCSLVVVALNSLRAVRQSSTSW 833
138 >gb|AE000396.1|AE000396 Escherichia coli K-12 MG1655 section 286 of 400 of the complete
139            genome
140           Length = 10098
142  Score = 29.0 bits (57), Expect = 3.0
143  Identities = 9/27 (33%), Positives = 18/27 (66%)
144  Frame = -3 / -1
146                                       
147 Query: 633 PPSKIYLLAPYHQYKLLLKTSSFASVF 553
148            PP++ YLL+P H+++++   S +   F
149 Sbjct: 309 PPARFYLLSPVHEWRVIAS*SWYHQSF 229
152 >gb|AE000466.1|AE000466 Escherichia coli K-12 MG1655 section 356 of 400 of the complete
153             genome
154           Length = 10208
156  Score = 26.3 bits (51), Expect(2) = 3.4
157  Identities = 11/26 (42%), Positives = 14/26 (53%)
158  Frame = +3 / +2
160                                       
161 Query: 2796 SPEVFLPCFTARWFLLAWPLSLSCLC 2873
162             S  V L C T  ++L  W L+LS  C
163 Sbjct: 5579 SSAVVLRCLTTVFWLPVWALTLSICC 5656
166  Score = 20.3 bits (38), Expect(2) = 3.4
167  Identities = 4/11 (36%), Positives = 7/11 (63%)
168  Frame = +3 / +1
170                        
171 Query: 2892 LKKEKQGSWFD 2924
172             +K+  +G W D
173 Sbjct: 5737 MKRPFKGDWLD 5769
176 >gb|AE000482.1|AE000482 Escherichia coli K-12 MG1655 section 372 of 400 of the complete genome
177           Length = 20906
179  Score = 28.6 bits (56), Expect = 4.1
180  Identities = 14/48 (29%), Positives = 19/48 (39%)
181  Frame = +3 / +1
183                                                              
184 Query: 660   SQCQKSQGQVRLSSLRPHPVEPHPRVGQSTPRSREGRSQGWA*KSGQS 803
185              S+C    G  R    RP  + P       +P    GR +GW    GQ+
186 Sbjct: 20239 SRCALILGPARRWVHRPESLSPAASAHGQSPHVAAGRRRGWKRADGQN 20382
189 >gb|AE000341.1|AE000341 Escherichia coli K-12 MG1655 section 231 of 400 of the complete
190             genome
191           Length = 10231
193  Score = 28.6 bits (56), Expect = 4.1
194  Identities = 12/20 (60%), Positives = 13/20 (65%)
195  Frame = -2 / +2
197                                 
198 Query: 2995 PGD*HCRFRVTVSGGGREEG 2936
199             PG  H  +R TVSG GRE G
200 Sbjct: 7538 PGWLHAVYRETVSGSGREAG 7597
203 >gb|AE000198.1|AE000198 Escherichia coli K-12 MG1655 section 88 of 400 of the complete genome
204           Length = 11639
206  Score = 28.6 bits (56), Expect = 4.1
207  Identities = 11/22 (50%), Positives = 15/22 (68%)
208  Frame = +1 / +3
210                                    
211 Query: 2332  FPKSNY*TGGYYEGP*ASGFCL 2397
212              F +S  * GGY+ GP +S FC+
213 Sbjct: 10947 FQRSGG*PGGYHAGPGSSPFCV 11012
216 >gb|AE000367.1|AE000367 Escherichia coli K-12 MG1655 section 257 of 400 of the complete
217             genome
218           Length = 11438
220  Score = 28.6 bits (56), Expect = 4.1
221  Identities = 8/27 (29%), Positives = 13/27 (47%)
222  Frame = +3 / -2
224                                        
225 Query: 1332 CFLSPSFLWLSSCHRKGISNRVQFRMG 1412
226             C  + +F+W + CH+  I     F  G
227 Sbjct: 7990 CLFAAAFVWFAKCHQPVIGRNTTFSKG 7910
230 >gb|AE000136.1|AE000136 Escherichia coli K-12 MG1655 section 26 of 400 of the complete genome
231           Length = 16823
233  Score = 28.6 bits (56), Expect = 4.1
234  Identities = 11/23 (47%), Positives = 12/23 (51%)
235  Frame = -2 / +1
237                                     
238 Query: 2860  RLSGQARRNHLAVKHGRNTSGER 2792
239              RLSG+ RR   A  H    SG R
240 Sbjct: 13873 RLSGKVRRRGSAASHFLYLSGSR 13941
243 >gb|AE000327.1|AE000327 Escherichia coli K-12 MG1655 section 217 of 400 of the complete
244             genome
245           Length = 10048
247  Score = 28.1 bits (55), Expect = 5.7
248  Identities = 9/19 (47%), Positives = 12/19 (62%)
249  Frame = +1 / +2
251                                
252 Query: 1231 WTTSRAPLPH*VSCTVTSC 1287
253             W  S  P+PH   C+V+SC
254 Sbjct: 2426 WRQSLYPIPHCYRCSVSSC 2482
257 >gb|AE000498.1|AE000498 Escherichia coli K-12 MG1655 section 388 of 400 of the complete
258             genome
259           Length = 10264
261  Score = 27.6 bits (54), Expect = 7.8
262  Identities = 8/18 (44%), Positives = 10/18 (55%)
263  Frame = +3 / +3
265                               
266 Query: 2670 YAVFYITYCFSCPHECLF 2723
267             +   + T C SCPH C F
268 Sbjct: 4278 FITLHFT*CVSCPHNCSF 4331
271 >gb|AE000509.1|AE000509 Escherichia coli K-12 MG1655 section 399 of 400 of the complete
272            genome
273           Length = 10589
275  Score = 27.6 bits (54), Expect = 7.8
276  Identities = 8/17 (47%), Positives = 12/17 (70%)
277  Frame = -2 / -3
279                             
280 Query: 682 PWLFWHWLRSWTSNPQP 632
281            P L W+W+R   S+P+P
282 Sbjct: 261 PSLLWYWVRRCLSSPRP 211
285 >gb|AE000306.1|AE000306 Escherichia coli K-12 MG1655 section 196 of 400 of the complete
286             genome
287           Length = 10446
289  Score = 27.6 bits (54), Expect = 7.8
290  Identities = 7/18 (38%), Positives = 12/18 (65%)
291  Frame = +3 / +1
293                               
294 Query: 1341 SPSFLWLSSCHRKGISNR 1394
295             +P+  W+S CHR+ +  R
296 Sbjct: 136  TPAGCWISGCHRRSVQQR 189
299 >gb|AE000203.1|AE000203 Escherichia coli K-12 MG1655 section 93 of 400 of the complete genome
300           Length = 10751
302  Score = 27.6 bits (54), Expect = 7.8
303  Identities = 13/47 (27%), Positives = 23/47 (48%)
304  Frame = +1 / +3
306                                                            
307 Query: 1156 LLWATLR*RLMARKCSVPLVMAWLTWTTSRAPLPH*VSCTVTSCTWI 1296
308             +L  T R    A   +  +V +   WT S  P P  + C+++S +W+
309 Sbjct: 1554 ILRLTYRLPTWAEPVTWAMVSSMRVWTPSVRP*PEALICSISSGSWL 1694
312 >gb|AE000208.1|AE000208 Escherichia coli K-12 MG1655 section 98 of 400 of the complete genome
313           Length = 10619
315  Score = 27.6 bits (54), Expect = 7.8
316  Identities = 10/25 (40%), Positives = 15/25 (60%)
317  Frame = -3 / +3
319                                      
320 Query: 981  LSCNLDTNLPRASPPTSSTFTLPHR 907
321             ++C L      + P  ++TFTLPHR
322 Sbjct: 2829 VACTLTCKYRLSLPQRANTFTLPHR 2903
325   Database: ecoli.nt
326     Posted date:  Jun 14, 2001  3:27 PM
327   Number of letters in database: 4,662,239
328   Number of sequences in database:  400
329   
330 Lambda     K      H
331    0.318    0.135    0.401 
334 Matrix: BLOSUM62
335 Number of Hits to DB: 31907970
336 Number of Sequences: 400
337 Number of extensions: 491769
338 Number of successful extensions: 23184
339 Number of sequences better than 10.0: 20
340 length of query: 1000
341 length of database: 1,554,079
342 effective HSP length: 47
343 effective length of query: 953
344 effective length of database: 1,535,279
345 effective search space: 1463120887
346 effective search space used: 1463120887
347 frameshift window, decay const: 50,  0.1
348 T: 13
349 A: 40
350 X1: 16 ( 7.3 bits)
351 X2: 0 ( 0.0 bits)
352 S1: 41 (21.7 bits)
353 S2: 53 (27.2 bits)