assembly_post_processor: assembly_post

annotate assembly_post_processor.xml @ 10:db0c2baf176f draft

Uploaded

author	greg
date	Tue, 31 Jan 2017 13:34:49 -0500
parents	5a0a049d11aa
children	ef522c398ad4

rev	line source
5 31673ee3734f Uploaded greg parents: 4 diff changeset	1 <tool id="plant_tribes_assembly_post_processor" name="Postprocess de novo assembly transcripts" version="0.3">
31673ee3734f Uploaded greg parents: 4 diff changeset	2 <description>into putative coding sequences</description>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	3 <requirements>
5 31673ee3734f Uploaded greg parents: 4 diff changeset	4 <requirement type="package" version="0.3">plant_tribes_assembly_post_processor</requirement>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	5 </requirements>
cecea7fdccf8 Uploaded greg parents: diff changeset	6 <stdio>
cecea7fdccf8 Uploaded greg parents: diff changeset	7 <!-- Anything other than zero is an error -->
cecea7fdccf8 Uploaded greg parents: diff changeset	8 <exit_code range="1:" />
6 bf355f832557 Uploaded greg parents: 5 diff changeset	9 <exit_code range=":-1" />
bf355f832557 Uploaded greg parents: 5 diff changeset	10 <!-- In case the return code has not been set propery check stderr too -->
0 cecea7fdccf8 Uploaded greg parents: diff changeset	11 <regex match="Error:" />
cecea7fdccf8 Uploaded greg parents: diff changeset	12 <regex match="Exception:" />
cecea7fdccf8 Uploaded greg parents: diff changeset	13 </stdio>
cecea7fdccf8 Uploaded greg parents: diff changeset	14 <command>
cecea7fdccf8 Uploaded greg parents: diff changeset	15 <![CDATA[
10 db0c2baf176f Uploaded greg parents: 9 diff changeset	16 #import os
0 cecea7fdccf8 Uploaded greg parents: diff changeset	17 AssemblyPostProcesser
8 e5110df5314b Uploaded greg parents: 7 diff changeset	18 --transcripts '$input'
0 cecea7fdccf8 Uploaded greg parents: diff changeset	19 --prediction_method $prediction_method_cond.prediction_method
cecea7fdccf8 Uploaded greg parents: diff changeset	20 #if str($prediction_method_cond.prediction_method) == 'estscan':
8 e5110df5314b Uploaded greg parents: 7 diff changeset	21 --score_matrices '$score_matrices'
0 cecea7fdccf8 Uploaded greg parents: diff changeset	22 #end if
cecea7fdccf8 Uploaded greg parents: diff changeset	23 #if str($options_type.options_type_selector) == 'advanced':
cecea7fdccf8 Uploaded greg parents: diff changeset	24 #if str($options_type.target_gene_family_assembly_cond.target_gene_family_assembly) == 'yes':
10 db0c2baf176f Uploaded greg parents: 9 diff changeset	25 #set scaffold_path = '$options_type.target_gene_family_assembly_cond.scaffold.path'
db0c2baf176f Uploaded greg parents: 9 diff changeset	26 #set scaffold_dir = os.path.split($scaffold_path)[0]
db0c2baf176f Uploaded greg parents: 9 diff changeset	27 #set scaffold = os.path.split($scaffold_path)[1]
8 e5110df5314b Uploaded greg parents: 7 diff changeset	28 --gene_family_search '$options_type.target_gene_family_assembly_cond.orthogroups'
10 db0c2baf176f Uploaded greg parents: 9 diff changeset	29 --scaffold_dir $scaffold_dir
db0c2baf176f Uploaded greg parents: 9 diff changeset	30 --scaffold $scaffold
8 e5110df5314b Uploaded greg parents: 7 diff changeset	31 --method '$options_type.target_gene_family_assembly_cond.method'
0 cecea7fdccf8 Uploaded greg parents: diff changeset	32 #end if
cecea7fdccf8 Uploaded greg parents: diff changeset	33 --gap_trimming $options_type.gap_trimming
cecea7fdccf8 Uploaded greg parents: diff changeset	34 #if str($options_type.strand_specific) == 'yes':
cecea7fdccf8 Uploaded greg parents: diff changeset	35 --strand_specific
cecea7fdccf8 Uploaded greg parents: diff changeset	36 #end if
cecea7fdccf8 Uploaded greg parents: diff changeset	37 #if str($options_type.dereplicate) == 'yes':
cecea7fdccf8 Uploaded greg parents: diff changeset	38 --dereplicate
cecea7fdccf8 Uploaded greg parents: diff changeset	39 #end if
cecea7fdccf8 Uploaded greg parents: diff changeset	40 --min_length $options_type.min_length
cecea7fdccf8 Uploaded greg parents: diff changeset	41 #end if
cecea7fdccf8 Uploaded greg parents: diff changeset	42 --num_threads \${GALAXY_SLOTS:-4}
cecea7fdccf8 Uploaded greg parents: diff changeset	43 ]]>
cecea7fdccf8 Uploaded greg parents: diff changeset	44 </command>
cecea7fdccf8 Uploaded greg parents: diff changeset	45 <inputs>
cecea7fdccf8 Uploaded greg parents: diff changeset	46 <param name="input" format="fasta" type="data" label="De novo transcriptome assembly fasta file"/>
cecea7fdccf8 Uploaded greg parents: diff changeset	47 <conditional name="prediction_method_cond">
cecea7fdccf8 Uploaded greg parents: diff changeset	48 <param name="prediction_method" type="select" label="Prediction method for coding regions">
cecea7fdccf8 Uploaded greg parents: diff changeset	49 <option value="transdecoder" selected="true">TransDecoder</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	50 <option value="estscan">ESTScan</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	51 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	52 <when value="transdecoder" />
cecea7fdccf8 Uploaded greg parents: diff changeset	53 <when value="estscan">
cecea7fdccf8 Uploaded greg parents: diff changeset	54 <param name="score_matrices" format="smat" type="data" label="Scores matrices"/>
cecea7fdccf8 Uploaded greg parents: diff changeset	55 </when>
cecea7fdccf8 Uploaded greg parents: diff changeset	56 </conditional>
cecea7fdccf8 Uploaded greg parents: diff changeset	57 <conditional name="options_type">
cecea7fdccf8 Uploaded greg parents: diff changeset	58 <param name="options_type_selector" type="select" label="Options Configuration">
cecea7fdccf8 Uploaded greg parents: diff changeset	59 <option value="basic" selected="true">Basic</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	60 <option value="advanced">Advanced</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	61 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	62 <when value="basic" />
cecea7fdccf8 Uploaded greg parents: diff changeset	63 <when value="advanced">
cecea7fdccf8 Uploaded greg parents: diff changeset	64 <conditional name="target_gene_family_assembly_cond">
cecea7fdccf8 Uploaded greg parents: diff changeset	65 <param name="target_gene_family_assembly" type="select" label="Target gene family assembly?">
cecea7fdccf8 Uploaded greg parents: diff changeset	66 <option value="no" selected="true">No</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	67 <option value="yes">Yes</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	68 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	69 <when value="no" />
cecea7fdccf8 Uploaded greg parents: diff changeset	70 <when value="yes">
cecea7fdccf8 Uploaded greg parents: diff changeset	71 <param name="orthogroups" format="tabular" type="data" label="List of orthogroup identifiers for target gene families to assemble"/>
cecea7fdccf8 Uploaded greg parents: diff changeset	72 <param name="scaffold" type="select" label="Orthogroups or gene families proteins scaffold">
cecea7fdccf8 Uploaded greg parents: diff changeset	73 <options from_data_table="plant_tribes_scaffolds" />
10 db0c2baf176f Uploaded greg parents: 9 diff changeset	74 <validator type="no_options" message="No PlantTribes scaffolds are available. Use the PlantTribes Scaffolds Download Data Manager tool in Galaxy to install and populate the PlantTribes scaffolds data table."/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	75 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	76 <param name="method" type="select" label="Protein clustering method">
cecea7fdccf8 Uploaded greg parents: diff changeset	77 <option value="gfam" selected="true">GFam</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	78 <option value="orthofinder">OrthoFinder</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	79 <option value="orthomcl">OrthoMCL</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	80 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	81 </when>
cecea7fdccf8 Uploaded greg parents: diff changeset	82 </conditional>
3 d651432961fb Uploaded greg parents: 2 diff changeset	83 <param name="gap_trimming" type="float" value="0.1" min="0" max="1.0" label="Remove sites in alignments with gaps of" help="0.1 removes sites with 90% gaps"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	84 <param name="strand_specific" type="select" label="De novo transcriptome assembly was performed with strand-specific library?">
cecea7fdccf8 Uploaded greg parents: diff changeset	85 <option value="no" selected="true">No</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	86 <option value="yes">Yes</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	87 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	88 <param name="dereplicate" type="select" label="Remove repeated sequences in predicted coding regions?">
cecea7fdccf8 Uploaded greg parents: diff changeset	89 <option value="no" selected="true">No</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	90 <option value="yes">Yes</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	91 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	92 <param name="min_length" type="integer" value="200" label="Minimum sequence length of predicted coding regions"/>
cecea7fdccf8 Uploaded greg parents: diff changeset	93 </when>
cecea7fdccf8 Uploaded greg parents: diff changeset	94 </conditional>
cecea7fdccf8 Uploaded greg parents: diff changeset	95 </inputs>
cecea7fdccf8 Uploaded greg parents: diff changeset	96 <outputs>
cecea7fdccf8 Uploaded greg parents: diff changeset	97 <collection name="transcripts" type="list">
1 974edd8437e2 Uploaded greg parents: 0 diff changeset	98 <discover_datasets pattern="__name__" directory="assemblyPostProcessing_dir" visible="true" ext="fasta" />
0 cecea7fdccf8 Uploaded greg parents: diff changeset	99 </collection>
cecea7fdccf8 Uploaded greg parents: diff changeset	100 </outputs>
cecea7fdccf8 Uploaded greg parents: diff changeset	101 <tests>
cecea7fdccf8 Uploaded greg parents: diff changeset	102 <test>
cecea7fdccf8 Uploaded greg parents: diff changeset	103 <param name="input" value="assembly.fasta" ftype="fasta" />
cecea7fdccf8 Uploaded greg parents: diff changeset	104 <param name="prediction_method" value="transdecoder" />
6 bf355f832557 Uploaded greg parents: 5 diff changeset	105 <output_collection name="transcripts" type="list">
8 e5110df5314b Uploaded greg parents: 7 diff changeset	106 <element name="transcripts.cds" file="transcripts.cds" ftype="fasta"/>
e5110df5314b Uploaded greg parents: 7 diff changeset	107 <element name="transcripts.cleaned.cds" file="transcripts.cleaned.cds" ftype="fasta"/>
e5110df5314b Uploaded greg parents: 7 diff changeset	108 <element name="transcripts.cleaned.pep" file="transcripts.cleaned.pep1" ftype="fasta"/>
e5110df5314b Uploaded greg parents: 7 diff changeset	109 <element name="transcripts.pep" file="transcripts.pep" ftype="fasta"/>
6 bf355f832557 Uploaded greg parents: 5 diff changeset	110 </output_collection>
bf355f832557 Uploaded greg parents: 5 diff changeset	111 </test>
bf355f832557 Uploaded greg parents: 5 diff changeset	112 <test>
bf355f832557 Uploaded greg parents: 5 diff changeset	113 <param name="input" value="assembly.fasta" ftype="fasta" />
bf355f832557 Uploaded greg parents: 5 diff changeset	114 <param name="prediction_method" value="transdecoder" />
0 cecea7fdccf8 Uploaded greg parents: diff changeset	115 <param name="options_type_selector" value="advanced" />
7 4d82da0ca014 Uploaded greg parents: 6 diff changeset	116 <param name="gap_trimming" value="0.1" />
0 cecea7fdccf8 Uploaded greg parents: diff changeset	117 <param name="dereplicate" value="yes" />
7 4d82da0ca014 Uploaded greg parents: 6 diff changeset	118 <param name="min_length" value="200" />
0 cecea7fdccf8 Uploaded greg parents: diff changeset	119 <output_collection name="transcripts" type="list">
7 4d82da0ca014 Uploaded greg parents: 6 diff changeset	120 <element name="transcripts.cds" file="transcripts.cds" ftype="fasta" compare="contains"/>
4d82da0ca014 Uploaded greg parents: 6 diff changeset	121 <element name="transcripts.cleaned.cds" file="transcripts.cleaned.cds" ftype="fasta" compare="contains"/>
8 e5110df5314b Uploaded greg parents: 7 diff changeset	122 <element name="transcripts.cleaned.nr.cds" file="transcripts.cleaned.nr.cds" ftype="fasta" compare="contains"/>
e5110df5314b Uploaded greg parents: 7 diff changeset	123 <element name="transcripts.cleaned.nr.pep" file="transcripts.cleaned.nr.pep" ftype="fasta" compare="contains"/>
7 4d82da0ca014 Uploaded greg parents: 6 diff changeset	124 <element name="transcripts.cleaned.pep" file="transcripts.cleaned.pep2" ftype="fasta" compare="contains"/>
4d82da0ca014 Uploaded greg parents: 6 diff changeset	125 <element name="transcripts.pep" file="transcripts.pep" ftype="fasta" compare="contains"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	126 </output_collection>
cecea7fdccf8 Uploaded greg parents: diff changeset	127 </test>
cecea7fdccf8 Uploaded greg parents: diff changeset	128 </tests>
cecea7fdccf8 Uploaded greg parents: diff changeset	129 <help>
cecea7fdccf8 Uploaded greg parents: diff changeset	130 This tool is one of the PlantTribes' collection of automated modular analysis pipelines that utilize objective classifications of
5 31673ee3734f Uploaded greg parents: 4 diff changeset	131 complete protein sequences from sequenced plant genomes to perform comparative evolutionary studies. It postprocesses de novo assembly
31673ee3734f Uploaded greg parents: 4 diff changeset	132 transcripts into putative coding sequences and their corresponding amino acid translations, locally assembling targeted gene families.
0 cecea7fdccf8 Uploaded greg parents: diff changeset	133
cecea7fdccf8 Uploaded greg parents: diff changeset	134 -----
cecea7fdccf8 Uploaded greg parents: diff changeset	135
cecea7fdccf8 Uploaded greg parents: diff changeset	136 Options
cecea7fdccf8 Uploaded greg parents: diff changeset	137
cecea7fdccf8 Uploaded greg parents: diff changeset	138 * Prediction method for coding regions - The prediction method for coding regions; one of ESTScan or TransDecoder.
cecea7fdccf8 Uploaded greg parents: diff changeset	139 * Scores matrices - Scores matrices that reflect the codons preferences in the studied organisms.
5 31673ee3734f Uploaded greg parents: 4 diff changeset	140 * Target gene family assembly? - Select 'Yes' to target gene families to assemble.
31673ee3734f Uploaded greg parents: 4 diff changeset	141 * List of orthogroup identifiers for target gene families to assemble - History item with a list of orthogroup identifiers for target gene families to assemble.
0 cecea7fdccf8 Uploaded greg parents: diff changeset	142 * Orthogroups or gene families proteins scaffold - PlantTribes scaffolds data.
5 31673ee3734f Uploaded greg parents: 4 diff changeset	143 * Protein clustering method - One of GFam (domain architecture based clustering), OrthoFinder (broadly defined clusters) or OrthoMCL (narrowly defined clusters).
31673ee3734f Uploaded greg parents: 4 diff changeset	144 * Remove sites in alignments with gaps of - Removes gappy sites in alignments (i.e. 0.1 removes sites with 90% gaps): [0.0 to 1.0]
31673ee3734f Uploaded greg parents: 4 diff changeset	145 * De novo transcriptome assembly was performed with strand-specific library? - Select 'Yes' if de novo transcriptome assembly was performed with strand-specific library.
0 cecea7fdccf8 Uploaded greg parents: diff changeset	146 * Remove repeated sequences in predicted coding regions? - Select yes to remove repeated sequences in predicted coding regions.
cecea7fdccf8 Uploaded greg parents: diff changeset	147 * Minimum sequence length of predicted coding regions - Set the minimum sequence length of predicted coding regions.
cecea7fdccf8 Uploaded greg parents: diff changeset	148
cecea7fdccf8 Uploaded greg parents: diff changeset	149 </help>
cecea7fdccf8 Uploaded greg parents: diff changeset	150 <citations>
cecea7fdccf8 Uploaded greg parents: diff changeset	151 <citation type="bibtex">
cecea7fdccf8 Uploaded greg parents: diff changeset	152 @unpublished{None,
5 31673ee3734f Uploaded greg parents: 4 diff changeset	153 author = {Eric Wafula},
0 cecea7fdccf8 Uploaded greg parents: diff changeset	154 title = {None},
cecea7fdccf8 Uploaded greg parents: diff changeset	155 year = {None},
10 db0c2baf176f Uploaded greg parents: 9 diff changeset	156 url = {https://github.com/dePamphilis/PlantTribes}
0 cecea7fdccf8 Uploaded greg parents: diff changeset	157 }</citation>
8 e5110df5314b Uploaded greg parents: 7 diff changeset	158 <citation type="bibtex">
e5110df5314b Uploaded greg parents: 7 diff changeset	159 @published{Proc Int Conf Intell Syst Mol Biol,
e5110df5314b Uploaded greg parents: 7 diff changeset	160 author = {Iseli C, Jongeneel CV, Bucher P.},
e5110df5314b Uploaded greg parents: 7 diff changeset	161 title = {ESTScan: a program for detecting, evaluating, and reconstructing potential coding regions in EST sequences.},
e5110df5314b Uploaded greg parents: 7 diff changeset	162 year = {1999},
10 db0c2baf176f Uploaded greg parents: 9 diff changeset	163 url = {http://estscan.sourceforge.net/}
8 e5110df5314b Uploaded greg parents: 7 diff changeset	164 }</citation>
e5110df5314b Uploaded greg parents: 7 diff changeset	165 <citation type="doi">10.1038/nprot.2013.084</citation>
10 db0c2baf176f Uploaded greg parents: 9 diff changeset	166 <citation type="doi">10.1109/tcbb.2013.68</citation>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	167 </citations>
cecea7fdccf8 Uploaded greg parents: diff changeset	168 </tool>

Mercurial > repos > greg > assembly_post_processor

annotate assembly_post_processor.xml @ 10:db0c2baf176f draft