implementing a test for multi-categories parsing check feature.
[sgn.git] / mason / help / cosii_markers.mas
blob5e78262d8ab10fbc93ae5d45049046a0899c6c81
2   <center>
3     
5     <table summary="" width="720" cellpadding="0" cellspacing="0"
6     border="0">
7       <tr>
8         <td>
9           <center>
10             <h3>Conserved Ortholog Set (COS) markers</h3>
11           </center>
13           <p>We have used a computational method to screen the
14           tomato EST database against the arabidopsis genome
15           sequence in order to find a set of highly conserved,
16           single copy genes which can be used as markers for
17           comparative mapping between the tomato and arabidopsis
18           genomes. Currently we have identified approximately 1000
19           of these Conserved Ortholog Set (COS) markers.<br /></p>
21           <p>In this section of SGN, you will find sequence and
22           clone information for each of these COS markers as well
23           as their matching counterpart in the arabidopsis genome.
24           We have surveyed these COS markers and mapped some of
25           these COS markers on the tomato genome to provide a
26           tomato: arabidopsis comparative map. This mapping
27           information is available on SGN now.<br /></p>
29           <p>Because these COS markers are so highly conserved,
30           they may also be useful for comparative mapping in other
31           dicot species. The computational screen by how COS
32           markers were identified is described below:</p>
34           <ul>
35             <li>TBLASTX tomato ESTs against the arabidopsis genome
36             (specifically, the BAC tiling path from TAIR)</li>
38             <li>Identify single best matches (&lt; e -15) between a
39             single tomato EST (or associated contig) and a single
40             BAC in Arabidopsis. Each tomato EST must pass the
41             following criteria:
43               <ul>
44                 <li>it hits an arabidopsis sequence at a
45                 significance level of &lt; e -15</li>
47                 <li>it is determined to be NOT part of a domain
48                 (where several solanaceous sequences hit the same
49                 arabidopsis region)</li>
51                 <li>the next best Arabidopsis hit must be of lower
52                 significance (delta e &gt; 10)</li>
53               </ul>
54             </li>
56             <li>ESTs that pass all these criteria are classified as
57             conserved orthologs, all others are considered
58             potentially paralogous and eliminated.</li>
59           </ul><br />
61           <h4>Functional annotation of COS markers</h4>
63           <p>COS-markers were functionally annotated using the MIPS
64           role categories as they were defined at the time of the
65           analysis. As the functional role descriptions are subject
66           to continued changes, a copy of the role categories and
67           the COS-marker annotations as used in the analysis can be
68           found below:<br /></p>
70           <p><a href="/documents/markers/role_categories.txt">MIPS role categories at
71           time of COS marker annotation</a></p>
73           <h4>The list of COS markers is available in both online
74           and plain text format</h4>
76           <p><a href="/search/markers/cos_list.pl">COS list
77           online</a> - online format with links to sequences and
78           tiling path.<br />
79           <a href="/documents/markers/cos_list-old.txt">Old plain text download</a> - plain
80           text format for download. <br />
81           <a href="/documents/markers/cos_list.txt">Old plain text download 2</a> - plain
82           text format for download. 
83           </p>
85           <p><strong>Note:</strong> for the tomato map position in
86           the table linked above:</p>
88           <ul>
89             <li>Copy No is how many copies the COS marker shows on
90             a southern blot survey- S(single) is 1-2 copy, L(low)
91             is 3-4 copy, M(multiple) means more than 4 copy.</li>
93             <li>Map position is where the COS marker mapped on the
94             tomato: arabidopsis systeny map. For example, T1675 map
95             position is 01.005, meaning Chromosome 1, 5 cM down
96             from the top. Most of the COS markers have only one map
97             position, if the COS marker has a second or third map
98             position, then there were two or three alleles that
99             could be mapped.</li>
100           </ul><br />
101           <br />
102         </td>
103       </tr>
104     </table>
105     
106   </center>