new file: cell2loc.py
[GalaxyCodeBases.git] / perl / bsim / Readme.md
blob6e610b6ff63e891c30803f6420f765c75014289f
1 # Usage
3 ```
4 ./virusinserts.pl <Host.fa[.gz]> <Virus.fa[.gz]> <Outprefix>
6 ./virusinserts.pl /share/human/Chr1.fa /share/bsvir/HBV.AJ507799.2.fa test
7 ```
9 This will read "Ref.fa" as **Host genome**, and "Virus.fa" as **Virus sequence**, save output file to "Outprefix.ref.fa","Outprefix.1.fq","Outprefix.2.fq".
11 For both input files, **only** the first sequence is loaded. All follow sequences, if any, are simply ignored.
13 # Description
15 * It will random pick `$SampleCnt = 100` fragments from **Host**, each with a length of twice of `$PEinsertLen = 200`.
16 * Then, `$SampleCnt = 100` samples from **Virus** with a length of [`$VirFragMin = 20` , `$VirFragMax = 500`] are selected.
17 * For each of the `$SampleCnt = 100` sets, *Virus fragment* is insereted into the middle of *host fragment* to form our **Simulation Reference**, which will be write to "Outprefix.ref.fa" in FASTA format. The direction of *Virus fragment* is random chosen.
18 * On each *Simulation Reference*, PE90 of inster size 200bp are picked follow uniform distribution. Reads are write to "Outprefix.1.fq" and "Outprefix.2.fq" in FASTQ format.