Bio::DB::TFBS namespace has been moved to its own distribution named after itself
[bioperl-live.git] / t / data / NT_021877.gbk
blob5178c8f25636e2d03634ff92c856a878634d7609
1 LOCUS       NT_021877              10001 bp    DNA     linear   CON 17-OCT-2003
2 DEFINITION  Homo sapiens chromosome 1 genomic contig.
3 ACCESSION   NT_021877 REGION: 13920000..13930000
4 VERSION     NT_021877.16  GI:37539616
5 KEYWORDS    .
6 SOURCE      Homo sapiens (human)
7   ORGANISM  Homo sapiens
8             Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
9             Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo.
10 REFERENCE   1  (bases 1 to 10001)
11   AUTHORS   International Human Genome Sequencing Consortium.
12   TITLE     The DNA sequence of Homo sapiens
13   JOURNAL   Unpublished (2003)
14 COMMENT     GENOME ANNOTATION REFSEQ:  Features on this sequence have been
15             produced for build 34 of the NCBI's genome annotation [see
16             documentation].
17             On Oct 7, 2003 this sequence version replaced gi:29789880.
18             The DNA sequence is part of the second release of the finished
19             human reference genome. It was assembled from individual clone
20             sequences by the Human Genome Sequencing Consortium in consultation
21             with NCBI staff.
22             COMPLETENESS: not full length.
23 FEATURES             Location/Qualifiers
24      source          1..10001
25                      /organism="Homo sapiens"
26                      /mol_type="genomic DNA"
27                      /db_xref="taxon:9606"
28                      /chromosome="1"
29      source          <1..>10001
30                      /organism="Homo sapiens"
31                      /mol_type="genomic DNA"
32                      /db_xref="taxon:9606"
33                      /clone="RP11-302I18"
34                      /note="Accession AL451081 sequenced by The Sanger Centre"
35      gene            complement(3024..6641)
36                      /gene="LOC127086"
37                      /note="Derived by automated computational analysis using
38                      gene prediction method: GNOMON."
39                      /db_xref="GeneID:127086"
40                      /db_xref="InterimID:127086"
41      mRNA            complement(join(3024..4108,4110..4258,4357..4533,
42                      5985..6225,6324..6641))
43                      /gene="LOC127086"
44                      /product="similar to ATP-dependent DNA helicase II, 70 kDa
45                      subunit (Lupus Ku autoantigen protein p70) (Ku70) (70 kDa
46                      subunit of Ku antigen) (Thyroid-lupus autoantigen) (TLAA)
47                      (CTC box binding factor 75 kDa subunit) (CTCBF) (CTC75)"
48                      /note="Derived by automated computational analysis using
49                      gene prediction method: GNOMON."
50                      /transcript_id="XM_060320.3"
51                      /db_xref="GI:37539614"
52                      /db_xref="GeneID:127086"
53                      /db_xref="InterimID:127086"
54      CDS             complement(join(3024..4108,4110..4258,4357..4533,
55                      5985..6225,6324..6641))
56                      /gene="LOC127086"
57                      /note="overriding stop codons"
58                      /codon_start=1
59                      /transl_except=(pos:complement(6444..6446),aa:OTHER)
60                      /transl_except=(pos:complement(4224..4226),
61                      aa:OTHER)
62                      /transl_except=(pos:complement(4067..4069),aa:OTHER)
63                      /transl_except=(pos:complement(4049..4051),aa:OTHER)
64                      /transl_except=(pos:complement(4046..4048),aa:OTHER)
65                      /transl_except=(pos:complement(3791..3793),aa:OTHER)
66                      /transl_except=(pos:complement(3678..3680),aa:OTHER)
67                      /transl_except=(pos:complement(3036..3038),aa:OTHER)
68                      /protein_id="XP_060320.3"
69                      /db_xref="GI:37539615"
70                      /db_xref="GeneID:127086"
71                      /db_xref="InterimID:127086"
72 ORIGIN      
73         1 atctctatgt gtcttttgta tccaatgtta actctagtcg ctgggaagtt ggatgtccct
74        61 ccttaatcag atttgatata acagcaagag atttccaaga aaataccaaa aaatctaatt
75       121 tcagcaaaaa gaaaaaattt ggcctccagt tttccagatg taggtagatt ctgtccaaaa
76       181 cagatatcat ttaaaattta attttaaatc ctttgagttc ttcaaaagaa gatatttaac
77       241 aaaatgtggg agctgatgac aattttaatt atttacaaag taattttctc agtaaaatga
78       301 gccatgcttc aaaagggaaa ataccaacaa tttgccaggc attgtacctt ctttaatttt
79       361 cttctttctt tctttctttc tttctttctt tctttctttc tttctttctt tctttctttc
80       421 tttctttctt tcttttcttt ctttctttct ttctttcttt cttgagacgt tgtctcgctc
81       481 tgtcacccag actagagtgc agtggcacca tctttgctca ctgcaagctc cgcctcctgg
82       541 gttcacgcca ttctcctgcc acagcctcct gtgaagctgg gactacaggt gcctgccacc
83       601 acgcccagct aattttttgt atttttggta gacacggggt ttcaccgtgt tagccaggat
84       661 ggtctcgatc tcctgacctc gtgatctgcc tgccttggcc tcccaaagtg ctgggattat
85       721 aggtgtgagc cactgtgccc ggccgccgcc tttaattttt ataaccactg tgaggagtgg
86       781 tattattatt tgtgctcaaa cgggctcaca gaagtaggta acttggttaa aatcacttag
87       841 ccattaagtg gtgaagttgg aattggaact cagatgtgtg tgaccctaat tttattgcta
88       901 ttcctttaca cttggaattt tggtattttc attgctgtag aagaatgaag ttagccacca
89       961 ctcattttgt tgacagattg accatatggc cttcctagaa gtgatcattg aactgatggt
90      1021 attagctatt tctcctcaga cttactgatt gattgccttt gtgtgcaaaa agctctgtgt
91      1081 tatgacagaa acaccaaaga atagcaaaga tctttacttt ccaggatatt caaatctaac
92      1141 tggaggaaga gaacatgtaa ataaaaacta tatatcacca ggtagtaatt aattagtcag
93      1201 agacaaccta atgtctcttc ttttttttat tctaaagata ataactacat attgcaggaa
94      1261 aatctcctct aatctcacca ttatttcctc aactcttttt ttcaatgcac acatatattt
95      1321 agatatttaa ttggatgata tttataaaca cttttatatc ctatttttta ttgaatattg
96      1381 tattatgagc actctttcat gacatattat tccaatgtat aatttttaat ggcagaataa
97      1441 tattcatagt attttaattt ataatatctt ctggacattt agattgtttc taatattttt
98      1501 aattttttat aaattatatt gcattgaaca tcctagacca caaatctttt ctcatgtctc
99      1561 tacttattga cttaggataa atttattcag gagaaatcga gaataaattt ctggagattc
100      1621 ctgatatatg ttgagaagac ataagagaga atggagatcc ctaaacagat ttcgggtgca
101      1681 ccacttcagt caccaccatt gtgggcacca ggccctagag gctaaagtac cacattatat
102      1741 ctccaattcg tttgccaggt ggtctgtatt ctttgcttct ttgatttctc tgaatagagc
103      1801 tttccattca tttgaagggg cactttctgg tggtgcctga tggcattttg cattacattt
104      1861 tatttactgc aaaataaatt ttatttaatg caaaatgcca ccagggtgcc atcagaaagt
105      1921 gccccttcaa atgagtagaa agtctccttt tatgattgca gtatagtttg acagagttag
106      1981 aattctttgc tgttttcata ttagctactt aggatctata taaatctcat tgcaacggaa
107      2041 ataccagagt gtcttgaggc tggctgactg gggccttatt tctagcattc taagaaggtg
108      2101 caagagaaag aaactagcac tagatgagac tcatgagcat aaaccccttc aaattgggag
109      2161 agatgtctgc atttgcagcc aaacttctat catcagcctt gattcctgac ataatgagtt
110      2221 gtgagttgtt ataatcatgg aagaaaaatg acttgagagg ataacatgga tgatgtgatt
111      2281 tgaagatgag ttcagtataa actttggtga aaaatcattc tgataaactg atcttaagac
112      2341 atcatgccat gtttgatggc tcatgcctgt aatcccagaa ctttgcagca gtttgggagg
113      2401 ctgaggcagg caggttgctt gagcccagga gtttgacacc agcctgggca acatggcgaa
114      2461 accctatctc ttaaaaaaaa aatacaaaaa gtagccagtc atggtggctc atgcctggag
115      2521 acccagctac ctgggaggct gacaggggag gttcacctga accgggggaa gatctgagcc
116      2581 atgattgtgc cactacactc cagcctagga ctctctctgt ctcttaaaaa acaaaaaaaa
117      2641 caaaaaaaaa aaaacaaaaa aaaacaaagg catcacattg tttactccct tgtgatgccg
118      2701 gctggagtga cacttggcat caggagggca gtatagtctc tcttttttct tacagtacaa
119      2761 agttagggct cctcattcag gcagtagagt aaagaacagc aaagtgggag ggctacacca
120      2821 ttgccatggc aacagaaagc ctcctgaaga taaagtccct ctgcttctgt caggcagact
121      2881 cttcctagat caggagacac ctgttttcac tggctgagaa caaggccagg tagcctggtt
122      2941 acagtgtgga agggcagctg gacacatggc ctctggtcag ttctggaagt gattggtgaa
123      3001 ggcttccagt ggctcctgct tcttcagcct gctcttcagc ccatacccca gcaggtctct
124      3061 ttcagcatgg gcacggcaaa cttgcccagc atgctgttgc ttatgtgggt cttcagctcc
125      3121 tcttctgaat actccacctt gggccttttg cttctgaaac cttcattatt gtgttttatg
126      3181 ttgctaactt tcccttcagg attgtaatct ggtgggtaga gaagttcctt aaacttatcc
127      3241 accagtgggg agcccagtct tttattcatt gcttcaacct caggcaatgt caggtccact
128      3301 gcttgttcag gctccatcaa atccaaggcc aaggcctcca ggttcctgga acactgctgc
129      3361 agcacagagt tctcaaagct gtcacttctg tatttgaatc ggagcttctg aacaatagcc
130      3421 ttcaccttgt ccccctgctc tggggttgcc atgacttttt tagcaaaggg caccttccct
131      3481 ttattatcag cataacataa aaagaccagc tggaagcctg caggaggcac ctgaattttc
132      3541 tgatcatcca actcctcttc ctgtggcacc aaagccacaa aataaggggg gatgttcctg
133      3601 cagggtgtgt atctgcacaa tgctgtgacc tccttctcca gacacttgat gagtagagca
134      3661 ctgaacaggg ttgagctcta attcatcagt gactcttcag agtacacaaa caaggagggc
135      3721 ctcaggtaac ggtgcttctt cagctttacc aagggcttaa acccatgaga atcaaacctg
136      3781 gttcatcaaa ctattttagc tcttctgttt cctctttctc cagtataatc tgacgccttc
137      3841 catagatctg agacctcttg gtatctctag acagaagcca actgcctgta tttacattaa
138      3901 atatccaggt cttggttttc actgattcat ctatttctcg atagggcttt attggaggag
139      3961 gcttgagagc cttctggatc ggattataaa tgcccacaga gagcactata tctttattga
140      4021 gcttcagctt taacctgctg agtgttcact aactgatctc cttggctcaa acctgcctca
141      4081 acaggtcttc tagctttctg gattcctcag tgagccctgg ggtcctcatc ctctgctatg
142      4141 ctggtgatat ctctgtagaa gaaaggtata tcaaagccct cagttttctt caggtgcatc
143      4201 aagtcaagga agatgcctgt atctcagtga ttattggctt tggtcctggc ccagctggct
144      4261 ttggcatgtc attgccatgg gggttatcct cattggtgaa caacatgact cctcttgtac
145      4321 agtacattgc taaagaggtt gttggcacag actcacagca cttcactgag tgagtagtca
146      4381 gatccatgcc catcaggtct tggaaacgtt tttgtccctg ctgctcctta aaccggtcaa
147      4441 gctctagaat tcgttttgcc cctggattat ccaactcctg gatgctcatg tcaaaaggag
148      4501 tcaactcatc ttcactctga gattcaaaca tagctctgga ggcatcaacc aaaaaaatca
149      4561 aactatttct tcctgaatat ttatagactc cacttgcttc acatgattct catgggtttc
150      4621 aagcccttgg taatgctgaa gtgctgtgga tctgtgccaa cctctttagc gatgtccagt
151      4681 tcaaaatgtt cttcttctgc ttcttcatca cccctggttt tgtaataaga ctttcaccct
152      4741 gacatgttgc ttactgctca ctttggtgca ggccagagca gtatgatttc ttaaaattct
153      4801 ctctgccagt ctggcctctg tcccactaca ttatttcaga gacccaagag tgttccaaag
154      4861 gaatgttctg atattgataa caatacatat catcaaattg ctctctagaa atgtataaat
155      4921 gtacaactcc atcgtaagag tatgtgatag tgctccttac agtgtatcct caccaacatg
156      4981 gaatattatc ttttaaatat ctttgatgta ttattaattg tttttgtgga gtgctgtgac
157      5041 tcaggctttt agaagaagcc taggataaca caaacataat tctggttaaa atcgatcagc
158      5101 acagatgagt ggtgctggca atgactcgtc ttggctgaca ctggagaaaa taaaaggttt
159      5161 agccaatggg aagagaaaat gataagtttg gtttgagata agataaattt ggattatctg
160      5221 tgggacatcc aagaggtgat atgcagtagg tcattgagta tctctgtgtg ggggtgtgag
161      5281 atgtaaatag aaaatgaaag tattaatata tggtaagtag gtaaaatcat aaatgtaggt
162      5341 actatggttc aaggagaatt cagaatggga aaggagttga atatgaaatc ttggggaata
163      5401 tcaacattta aagggtcgca aaagacacat aagctaaagg tactgaattt tttttttttt
164      5461 tttttttttt agagatgagg tcttgcccta ttgcacaggc tggagtgcag cggtgcaatc
165      5521 atagctcact gaagccttga attcctgggc tgaagcaatt ctcccacatc agcctctgga
166      5581 gtagctaaga ctacaggcac aagccagcat gcccagagga aggcactttt ttttttcttt
167      5641 ttaaagaagt ctttatttcc ttgttctgca aataaagctg gctgagttgg ttgctttttg
168      5701 gtgattagtc agggaccaaa tcccatatcc ttgtccaatt cctccgactc ttccttggct
169      5761 tcaaccttag ttggggtagc agcagcagca ggagcagtca tggcagcagt gtccacaggg
170      5821 gcagcagcca caaaggcaga tggattaacc aagaaggcct tgaccttttc agcaagtggg
171      5881 aaggtgtaat caatctccac agacaaagcc aggactcgtt tgtacccatt gatgatagaa
172      5941 tggggtactg atgcaacagt tgggtagcca atctgcaaac agaccctgga aacatcgcag
173      6001 acactctcca gaaagtgaga atgcagtttc ctctgtgatg tcaagccctt cagggttgta
174      6061 gatgctgcca ttgtcgaaca cctgctgaat gaccagccca aagaagggag agatgttcag
175      6121 cagtgtggct tcgctggctc ccactttgtc tccagtcttg atcagctgca catcactcag
176      6181 gatttcagtg gcgcccctgg agattttagt ggtgatgcct aaaacctgga gaaacgaggt
177      6241 cttcttgggc cctagaccag tgttctggac tggcacagtg acttcacagg ggcaatggaa
178      6301 ccagcatgag ccacagctgg caccttgttg gccagcagca ggtccctgat ctcagtgagg
179      6361 tcctccttga tgaacacaaa gcccacattc ccctgaatat gaggcaacag tttctctaga
180      6421 gctgggttgt tttccaggtg ccttcagatg gccttgacca tcgtggtgtt cttgcctagc
181      6481 agcaccatgg ccttcctgca gagggatatg cggatctgct gcatctgctt agagcccata
182      6541 ttgtctgctc ccatgatgaa acatttcgga taatcatcca aaagttggat gatcttaagg
183      6601 aagtagttgg gcttccaggt caccctgtct tccctgggca tcacagcggt gtgtcaggga
184      6661 tttaaagaca caagggttta aagatgatgt cacttaaacg acgacacctg gtgagaggag
185      6721 gcacttttta tgaagagcca cagaggtaga aagaaaactc agagagtatt gtcattgaaa
186      6781 ataaagactt tcagaaagga gagaatagca tgtcacagag aaagaaaatt gagtaaatat
187      6841 tagtgattgt aaaatggtga tttagtctgt tttgtgctgc tattacaaaa tacctgagac
188      6901 tggataattt ataaagaaaa gaaatttatt ttctcacagt tctgagtgct agaaagtcta
189      6961 agattaaggt gacagcaggt tgcattttct ggtgagttct gcatcatcca gagggaagga
190      7021 acgctgtgtc ctcacatggt ggaaggctaa agagcaagcc agctgagtga ggcaagaaga
191      7081 ttctttaata aaggccttaa ttccattcat gaggggacca gctctcatga ccttatcatc
192      7141 tctagaaaac tccacctctt catactatca cattgcacta agtttcaaca tctgaatttt
193      7201 ggagcggaca cattcagact atagcagatg aagttttaat agaaataatt aatgtttagc
194      7261 aaccaagaag taccctcata cttccctgct tgttaatttc tacctttcag gttccccaag
195      7321 gggtggtaca cagaggaata tcaaataata accaaattgc aattttatta aggcccaagt
196      7381 caatgtcatt aacactcaat gcagctttgg cagggatagg tggacctctg gtttaggctc
197      7441 aaggcataaa tgagattttc taccctgtgt ttccatcccc gttccccact atgggtcaaa
198      7501 tctaaagctt aggatgttac ctacctgtgg tttgctgcat gatgaaagga tgtcaacgta
199      7561 agatctgaca gagcctcctg gggaaggcct gaatccactt atttatcacg ccacatggag
200      7621 taggaaacag agctcagaga aagactgtgt gcctgtgtga ccccaagaat cctatctttt
201      7681 ggccatggaa gcaactctgt ctcctgagca ggtggggagg ttcttgaaaa actaggaaca
202      7741 aaggctgtct gcttcatctt gtccctttag taggagaaag cagatccctt ctgcactcta
203      7801 ggaacttcac atacatacag ctcggacaat agcacttgaa aaattaccat cttctaagaa
204      7861 tagacccctt cactcatgag gatgtcttct agagcagtgc cattcaatag aattttctgt
205      7921 gatgatgaag atgctattta aatctgtcct gtccagtact gtagttacta tgtgaggtca
206      7981 ctgaagttat tattagcatt taaatttaaa tagccccctg tggatagtgg tgatcctatt
207      8041 atacagtgaa gctctaggga tttcagggaa ttgtgaaatc tgctgatact ttcatgatag
208      8101 tcttgttttc tcttttcagc ctctccatct ttatttgatt gattattcct ggttattcta
209      8161 ggtctgctct taaggtatgg attaatattc atgtatagct gatacaactt atggagcctc
210      8221 aggttctcga tctatgaaat gggaatgcta ataacaagtg ttccgttgtg gagattaaat
211      8281 gacataatta aaccataagt tccaaatatg caaatggctt tcttacttaa ttgcaaattg
212      8341 tcagggttta cccaatgcct gtaccaccat tgtatcttag aggtaaataa cttgtttttc
213      8401 atcttacagg ctcatagctg aaaggaactt accttgagtc tctaatgaga ctttggactt
214      8461 tagacttttg agatgatgct ggaatgagtt aagacttttg ggactattgg gaaaggatga
215      8521 ttgtattttg caatgtgaga agaacatgag tttgctaggg ggggcaggag tggaatgcta
216      8581 tggtttggat ataatttgtt tgtccccacc aaatcacatg ttgaaattta atccccagtg
217      8641 tagcgatgtt gggtggtggg gcctagtggg aagtatttgg gtcacaggag tggatcgttc
218      8701 atgaatatat caacgccctt ccactctgga gtggtgagtt ctcactatgt tagttcccat
219      8761 gtgagctggt tgttaaaaca atcctcgctt ctccctgccc tgccctcctc tcttagcgtg
220      8821 cagcctctgc acacaccagc tcctcttcgc catccaccac gagtggaagc agcctgaagg
221      8881 ttttatcaga tgcagatgcc caatcttgaa ctttccagcc atccagaatc ataaaacaaa
222      8941 taaaccttct ttttctttat aaattaccca acctccagta ttcctttata gcaaaacaaa
223      9001 acagactaag acagtcagtt ttctgcattg atttttgtga ttcagggttc cagccctctg
224      9061 gtgccatcaa taaatcacta ttcccaagtt aaagcaaatc cccatgagca ctggggatgt
225      9121 gcagatagtg agtggtggtg atggtgaggt gcaaccacga tctttttttt tttttttgag
226      9181 atgagtttta ctccatcacc aaggctgggg ctcagtggca tgatctcaac tcactgcaac
227      9241 ctcggcctcc tgggttcaag caattcttgt gcctcagcct cttaaatagc tgggactagg
228      9301 ggtgtgccac catgcctggc taatttttgc acttttatta gagatgaggc tttgccatgt
229      9361 tggtcagact ggtctctaac tcctgacctc aagtgatcca cctgcctggg cctcccaaag
230      9421 tgctgggatt acaggcatga gccaccgcac ccggcaccat gttcgattga agggagagat
231      9481 ggggagggaa cctcattact gtattcacat gataaagctc ccatagaaac tcagcatcaa
232      9541 ctaagtcaat tctagttttc attctaccaa caggcctccg ggctctggct tcctgaaggg
233      9601 taggagtgat atatacaaag acgtcaagtg ggtgaaaaaa aactccacct gtcccctcag
234      9661 aacgtggaga acctctttaa agttatgggg ctgaagactg atggcatcca cttatcagag
235      9721 ctcccccagg tatgaaagga gtagaagatt tttcagggtg gggcattaat gaattttcag
236      9781 aaataaagaa ataattgatt agtaatggtt ctactcaaca ggcactgttt actaacacca
237      9841 caatcctaca tattcctaaa gctgaggatg aacaaaagtt cattactttg agactctaat
238      9901 ttagacaaaa cttgaagcaa atcagtgatg aaagaaatcc tgctagctca gcaatcttcc
239      9961 tgtggtactt gtgtgtgtgt gtgtttgtgt gtgtatgcgt g