antismash: antismash.xml annotate

annotate antismash.xml @ 17:213d82f33fc2 draft

Uploaded

author	bgruening
date	Fri, 11 Oct 2013 19:24:56 -0400
parents	e2df6fe8b447
children	3d9f00b883a3

rev	line source
0 7ad005dfbe78 Uploaded bgruening parents: diff changeset	1 <tool id="antismash" name="Secondary Metabolites" version="2.0.2.0">
4 9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	2 <description>and Antibiotics Analysis (antiSMASH)</description>
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	3 <requirements>
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	4 <requirement type="package" version="3.0">hmmer</requirement>
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	5 <requirement type="package" version="2.2.28">blast+</requirement>
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	6 <requirement type="package" version="3.8.31">muscle</requirement>
17 213d82f33fc2 Uploaded bgruening parents: 16 diff changeset	7 <requirement type="package" version="1.4.0-post-1">straight.plugin</requirement>
213d82f33fc2 Uploaded bgruening parents: 16 diff changeset	8 <requirement type="package" version="0.1.2">helperlibs</requirement>
4 9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	9 <requirement type="package" version="2.0.2">antismash</requirement>
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	10 </requirements>
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	11 <command>
15 9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	12 #import os, glob
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	13 #set $outputfolder = os.path.join($html.files_path, 'antismash')
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	14 ln -s $infile #echo 'input_tempfile.' + $infile.ext#;
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	15 mkdir -p $outputfolder;
4 9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	16 run_antismash.py
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	17 --cpus 4
13 9cfa2fb488b0 Uploaded bgruening parents: 11 diff changeset	18 --enable $types
15 9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	19 --input-type 'nucl'
4 9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	20 $smcogs
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	21 $clusterblast
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	22 $subclusterblast
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	23 $inclusive
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	24 $full_hmmer
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	25 $full_blast
0 7ad005dfbe78 Uploaded bgruening parents: diff changeset	26
15 9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	27 #if str($pfam_database) != "None":
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	28 --pfamdir $pfam_database.fields.path
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	29 #end if
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	30
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	31 --disable-embl
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	32 --outputfolder $outputfolder
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	33
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	34
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	35 #echo 'input_tempfile.' + $infile.ext#
0 7ad005dfbe78 Uploaded bgruening parents: diff changeset	36
9 b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	37 ## leave out the start and end features, it can be easily replaced with Galaxy tools
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	38 ##--from START Start analysis at nucleotide specified
15 9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	39 ##--to END
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	40
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	41 ;
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	42 ## shuffling files to create the correct outputs for Galaxy
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	43
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	44 ## html output
16 e2df6fe8b447 Uploaded bgruening parents: 15 diff changeset	45 #if 'html' in str($outputs).split(','):
15 9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	46 cp #echo os.path.join($outputfolder, 'index.html')# $html;
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	47 #end if
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	48
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	49 ## gene clusters
16 e2df6fe8b447 Uploaded bgruening parents: 15 diff changeset	50 #if 'geneclusterprots_tabular' in str($outputs).split(','):
15 9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	51 cp #echo os.path.join($outputfolder, 'geneclusters.txt')# $geneclusterprots;
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	52 #end if
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	53
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	54 ##SVG images
16 e2df6fe8b447 Uploaded bgruening parents: 15 diff changeset	55 #if 'archive_svgs' in str($outputs).split(','):
15 9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	56 cd #echo os.path.join($outputfolder, 'svg')#;
16 e2df6fe8b447 Uploaded bgruening parents: 15 diff changeset	57 tar cfz $archive_svgs _all.svg genecluster;
15 9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	58 #end if
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	59
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	60 ##all files in a archive
16 e2df6fe8b447 Uploaded bgruening parents: 15 diff changeset	61 #if 'archive' in str($outputs).split(','):
15 9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	62 cd $outputfolder;
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	63 tar cf $archive *.zip;
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	64 #end if
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	65
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	66 ## genbank
16 e2df6fe8b447 Uploaded bgruening parents: 15 diff changeset	67 #if 'gb' in str($outputs).split(','):
15 9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	68 #for $gb_file in glob.glob( os.path.join($outputfolder, '*.gbk') ):
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	69 cat $gb_file >> $genbank;
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	70 #end for
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	71 #end if
0 7ad005dfbe78 Uploaded bgruening parents: diff changeset	72
7ad005dfbe78 Uploaded bgruening parents: diff changeset	73 </command>
7ad005dfbe78 Uploaded bgruening parents: diff changeset	74 <inputs>
7ad005dfbe78 Uploaded bgruening parents: diff changeset	75 <param name="infile" type="data" format="gb,embl" label="Nucleotide sequence file in GenBank or EMBL format"/>
7ad005dfbe78 Uploaded bgruening parents: diff changeset	76
11 d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	77 <param name="clusterblast" type="boolean" label="BLAST identified clusters against known clusters" truevalue="--clusterblast" falsevalue="" checked="True" />
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	78 <param name="smcogs" type="boolean" label="analysis of secondary metabolism gene families (smCOGs)"
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	79 falsevalue="" truevalue="--smcogs" checked="True" />
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	80
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	81 <param name="full_blast" type="boolean" label="Run a whole-genome BLAST analysis" truevalue="--full-blast" falsevalue="" checked="False" />
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	82 <param name="subclusterblast" type="boolean" label="Subcluster Blast analysis" truevalue="--subclusterblast" falsevalue="" checked="false" />
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	83 <param name="full_hmmer" type="boolean" label="Run a whole-genome Pfam analysis" truevalue="--full-hmmer" falsevalue="" checked="false" />
0 7ad005dfbe78 Uploaded bgruening parents: diff changeset	84
7ad005dfbe78 Uploaded bgruening parents: diff changeset	85 <param name="inclusive" type="boolean" label="Use inclusive algorithm for cluster detection" truevalue="--inclusive" falsevalue="" checked="false" />
7ad005dfbe78 Uploaded bgruening parents: diff changeset	86
15 9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	87 <param name="pfam_database" type="select" optional="true" label="Pfam database" help="Pfam Covariance models">
4 9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	88 <options from_file="antismash.loc">
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	89 <column name="value" index="0"/>
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	90 <column name="name" index="1"/>
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	91 <column name="path" index="2"/>
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	92 </options>
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	93 </param>
9b91d26ee080 Uploaded bgruening parents: 0 diff changeset	94
0 7ad005dfbe78 Uploaded bgruening parents: diff changeset	95 <param name="types" type="select" display="checkboxes" multiple="true" label="Gene cluster types to search">
9 b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	96 <option value="t1pks" selected="True">type I polyketide synthases</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	97 <option value="t2pks" selected="True">type II polyketide synthases</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	98 <option value="t3pks" selected="True">type III polyketide synthases</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	99 <option value="t4pks" selected="True">type IV polyketide synthases</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	100 <option value="transatpks" selected="True">trans-AT PKS</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	101 <option value="nrps" selected="True">nonribosomal peptide synthetases</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	102 <option value="terpene" selected="True">terpene synthases</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	103 <option value="lantipeptide" selected="True">lantipeptides</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	104 <option value="bacteriocin" selected="True">bacteriocins</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	105 <option value="blactam" selected="True">beta-lactams</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	106 <option value="amglyccycl" selected="True">aminoglycosides / aminocyclitols</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	107 <option value="aminocoumarin" selected="True">aminocoumarins</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	108 <option value="siderophore" selected="True">siderophores</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	109 <option value="ectoine" selected="True">ectoines</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	110 <option value="butyrolactone" selected="True">butyrolactones</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	111 <option value="indole" selected="True">indoles</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	112 <option value="nucleoside" selected="True">nucleosides</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	113 <option value="phosphoglycolipid" selected="True">phosphoglycolipids</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	114 <option value="oligosaccharide" selected="True">oligosaccharides</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	115 <option value="furan" selected="True">furans</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	116 <option value="hserlactone" selected="True">hserlactones</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	117 <option value="thiopeptide" selected="True">thiopeptides</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	118 <option value="phenazine" selected="True">phenazines</option>
b11e1dfbc7c9 Uploaded bgruening parents: 5 diff changeset	119 <option value="phosphonate" selected="True">phosphonates</option>
15 9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	120 <option value="other" selected="True">others</option>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	121 </param>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	122
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	123 <param name="outputs" type="select" multiple="true" label="Output formats">
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	124 <option value="geneclusterprots_fasta" selected="True">Gene cluster proteins (FASTA)</option>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	125 <option value="geneclusterprots_tabular">Gene cluster proteins (Tabular)</option>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	126 <option value="html" selected="True">Interactive summary page (html)</option>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	127 <option value="archive_svgs">All clusters as image (compressed)</option>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	128 <option value="archive">All files compressed</option>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	129 <option value="gb">Annotated genome (GenBank)</option>
0 7ad005dfbe78 Uploaded bgruening parents: diff changeset	130 </param>
7ad005dfbe78 Uploaded bgruening parents: diff changeset	131
7ad005dfbe78 Uploaded bgruening parents: diff changeset	132 </inputs>
7ad005dfbe78 Uploaded bgruening parents: diff changeset	133 <outputs>
15 9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	134 <data format="fasta" name="geneclusterprots" label="${tool.name} on ${on_string} (Gen Cluster Proteins)">
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	135 <filter>'geneclusterprots_fasta' in outputs</filter>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	136 </data>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	137 <data format="fasta" name="geneclusterprots" label="${tool.name} on ${on_string} (Gen Cluster Proteins)">
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	138 <filter>'geneclusterprots_tabular' in outputs</filter>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	139 </data>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	140 <data format="gzipped" name="archive" label="${tool.name} on ${on_string} (all files compressed)">
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	141 <filter>'archive' in outputs</filter>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	142 </data>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	143 <data format="gzipped" name="archive_svgs" label="${tool.name} on ${on_string} (SVG images)">
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	144 <filter>'archive_svgs' in outputs</filter>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	145 </data>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	146 <data format="html" name="html" label="${tool.name} on ${on_string} (html report)">
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	147 <filter>'html' in outputs</filter>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	148 </data>
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	149 <data name="genbank" format="genbank" label="${tool.name} on ${on_string} (genbank)">
9a099b9b6857 Uploaded bgruening parents: 13 diff changeset	150 <filter>'gb' in outputs</filter>
0 7ad005dfbe78 Uploaded bgruening parents: diff changeset	151 </data>
7ad005dfbe78 Uploaded bgruening parents: diff changeset	152 </outputs>
7ad005dfbe78 Uploaded bgruening parents: diff changeset	153 <help>
7ad005dfbe78 Uploaded bgruening parents: diff changeset	154
7ad005dfbe78 Uploaded bgruening parents: diff changeset	155 .. class:: infomark
7ad005dfbe78 Uploaded bgruening parents: diff changeset	156
7ad005dfbe78 Uploaded bgruening parents: diff changeset	157 What it does
7ad005dfbe78 Uploaded bgruening parents: diff changeset	158
7ad005dfbe78 Uploaded bgruening parents: diff changeset	159 antiSMASH allows the rapid genome-wide identification, annotation and analysis of secondary metabolite biosynthesis gene clusters in bacterial and fungal genomes.
7ad005dfbe78 Uploaded bgruening parents: diff changeset	160 It integrates and cross-links with a large number of in silico secondary metabolite analysis tools that have been published earlier.
7ad005dfbe78 Uploaded bgruening parents: diff changeset	161
7ad005dfbe78 Uploaded bgruening parents: diff changeset	162
7ad005dfbe78 Uploaded bgruening parents: diff changeset	163 Input
7ad005dfbe78 Uploaded bgruening parents: diff changeset	164
11 d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	165 The ideal input for antiSMASH is an annotated nucleotide file in Genbank format or EMBL format. If no annotation is available,
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	166 we recommend running your sequence through an annotation pipeline like RAST are one included in Galaxy.
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	167
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	168
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	169 There are several optional analyses that may or may not be run on your sequence.
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	170 Highly recommended is the Gene Cluster Blast Comparative Analysis, which runs BlastP using each amino acid sequence from a detected gene cluster as a
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	171 query on a large database of predicted protein sequences from secondary metabolite biosynthetic gene clusters, and pools the results to identify
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	172 the gene clusters that are most homologous to the gene cluster that was detected in your query nucleotide sequence.
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	173
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	174
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	175 Also available is the analysis of secondary metabolism gene families (smCOGs).
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	176 This analysis attempts to allocate each gene in the detected gene clusters to a secondary metabolism-specific gene
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	177 family using profile hidden Markov models specific for the conserved sequence region characteristic of this family.
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	178 Additionally, a phylogenetic tree is constructed of each gene together with the (max. 100) sequences of the smCOG seed alignment.
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	179
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	180
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	181 For the most thorough genome analysis, we provide genome-wide PFAM HMM analysis of all genes in the genome through modules of the CLUSEAN pipeline.
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	182 Of course, some regions important to secondary metabolism may have been missed in the gene cluster identification stage
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	183 (e.g. because they represent the biosynthetic pathway of a yet unknown secondary metabolite).
d2c2eb518142 Uploaded bgruening parents: 9 diff changeset	184 Therefore, when genome-wide PFAM HMM analysis is selected, the PFAM frequencies are also used to find all genome regions in which PFAM domains typical for secondary metabolism are overrepresented.
0 7ad005dfbe78 Uploaded bgruening parents: diff changeset	185
7ad005dfbe78 Uploaded bgruening parents: diff changeset	186
7ad005dfbe78 Uploaded bgruening parents: diff changeset	187 References
7ad005dfbe78 Uploaded bgruening parents: diff changeset	188
7ad005dfbe78 Uploaded bgruening parents: diff changeset	189 Marnix H. Medema, Kai Blin, Peter Cimermancic, Victor de Jager, Piotr Zakrzewski, Michael A. Fischbach, Tilmann Weber,
7ad005dfbe78 Uploaded bgruening parents: diff changeset	190 Rainer Breitling and Eriko Takano (2011). antiSMASH: Rapid identification, annotation and analysis of secondary metabolite biosynthesis gene clusters. Nucleic Acids Research, doi: 10.1093/nar/gkr466.
7ad005dfbe78 Uploaded bgruening parents: diff changeset	191
7ad005dfbe78 Uploaded bgruening parents: diff changeset	192 http://antismash.secondarymetabolites.org/help.html
7ad005dfbe78 Uploaded bgruening parents: diff changeset	193
7ad005dfbe78 Uploaded bgruening parents: diff changeset	194 </help>
7ad005dfbe78 Uploaded bgruening parents: diff changeset	195 </tool>

Mercurial > repos > bgruening > antismash

annotate antismash.xml @ 17:213d82f33fc2 draft