Update README.md
[sgn.git] / mason / help / cos_markers.mas
blobf52fa19a17ca064cb407ad9b543eaa45d59c2e61
3   <center>
4     
6     <table summary="" width="720" cellpadding="0" cellspacing="0"
7     border="0">
8       <tr>
9         <td>
10           <center>
11             <h3>Conserved Ortholog Set (COS) markers</h3>
12           </center>
14           <p>We have used a computational method to screen the
15           tomato EST database against the arabidopsis genome
16           sequence in order to find a set of highly conserved,
17           single copy genes which can be used as markers for
18           comparative mapping between the tomato and arabidopsis
19           genomes. Currently we have identified approximately 1000
20           of these Conserved Ortholog Set (COS) markers.<br /></p>
22           <p>In this section of SGN, you will find sequence and
23           clone information for each of these COS markers as well
24           as their matching counterpart in the arabidopsis genome.
25           We have surveyed these COS markers and mapped some of
26           these COS markers on the tomato genome to provide a
27           tomato: arabidopsis comparative map. This mapping
28           information is available on SGN now.<br /></p>
30           <p>Because these COS markers are so highly conserved,
31           they may also be useful for comparative mapping in other
32           dicot species. The computational screen by how COS
33           markers were identified is described below:</p>
35           <ul>
36             <li>TBLASTX tomato ESTs against the arabidopsis genome
37             (specifically, the BAC tiling path from TAIR)</li>
39             <li>Identify single best matches (&lt; e -15) between a
40             single tomato EST (or associated contig) and a single
41             BAC in Arabidopsis. Each tomato EST must pass the
42             following criteria:
44               <ul>
45                 <li>it hits an arabidopsis sequence at a
46                 significance level of &lt; e -15</li>
48                 <li>it is determined to be NOT part of a domain
49                 (where several solanaceous sequences hit the same
50                 arabidopsis region)</li>
52                 <li>the next best Arabidopsis hit must be of lower
53                 significance (delta e &gt; 10)</li>
54               </ul>
55             </li>
57             <li>ESTs that pass all these criteria are classified as
58             conserved orthologs, all others are considered
59             potentially paralogous and eliminated.</li>
60           </ul><br />
62           <h4>Functional annotation of COS markers</h4>
64           <p>COS-markers were functionally annotated using the MIPS
65           role categories as they were defined at the time of the
66           analysis. As the functional role descriptions are subject
67           to continued changes, a copy of the role categories and
68           the COS-marker annotations as used in the analysis can be
69           found below:<br /></p>
71           <p><a href="/documents/markers/role_categories.txt">MIPS role categories at
72           time of COS marker annotation</a></p>
74           <h4>The list of COS markers is available in both online
75           and plain text format</h4>
77           <p><a href="/search/markers/cos_list.pl">COS list
78           online</a> - online format with links to sequences and
79           tiling path.<br />
80           <a href="/documents/markers/cos_list-old.txt">Old plain text download</a> - plain
81           text format for download. <br />
82           <a href="/documents/markers/cos_list.txt">Old plain text download 2</a> - plain
83           text format for download. 
84           </p>
86           <p><strong>Note:</strong> for the tomato map position in
87           the table linked above:</p>
89           <ul>
90             <li>Copy No is how many copies the COS marker shows on
91             a southern blot survey- S(single) is 1-2 copy, L(low)
92             is 3-4 copy, M(multiple) means more than 4 copy.</li>
94             <li>Map position is where the COS marker mapped on the
95             tomato: arabidopsis systeny map. For example, T1675 map
96             position is 01.005, meaning Chromosome 1, 5 cM down
97             from the top. Most of the COS markers have only one map
98             position, if the COS marker has a second or third map
99             position, then there were two or three alleles that
100             could be mapped.</li>
101           </ul><br />
102           <br />
103         </td>
104       </tr>
105     </table>
106     
107   </center>