assembly_post_processor: assembly_post

annotate assembly_post_processor.xml @ 96:11e85af74c7e draft

Uploaded

author	greg
date	Thu, 26 Oct 2017 12:20:04 -0400
parents	7801f23bc5d9
children	9c4afc33bc87

rev	line source
74 9da5dc4b99cc Uploaded greg parents: 73 diff changeset	1 <tool id="plant_tribes_assembly_post_processor" name="AssemblyPostProcessor" version="@WRAPPER_VERSION@.3.0">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	2 <description>post-processes de novo transcriptome assembly</description>
37 cc4dba9f6ecd Uploaded greg parents: 36 diff changeset	3 <macros>
cc4dba9f6ecd Uploaded greg parents: 36 diff changeset	4 <import>macros.xml</import>
cc4dba9f6ecd Uploaded greg parents: 36 diff changeset	5 </macros>
74 9da5dc4b99cc Uploaded greg parents: 73 diff changeset	6 <requirements>
9da5dc4b99cc Uploaded greg parents: 73 diff changeset	7 <requirement type="package" version="1.0.3">plant_tribes_assembly_post_processor</requirement>
9da5dc4b99cc Uploaded greg parents: 73 diff changeset	8 </requirements>
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	9 <command detect_errors="exit_code"><![CDATA[
86 126430ebebf7 Uploaded greg parents: 85 diff changeset	10 #set output_dir = 'assemblyPostProcessing_dir'
126430ebebf7 Uploaded greg parents: 85 diff changeset	11 AssemblyPostProcessor
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	12 --transcripts '$input'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	13 --prediction_method $prediction_method_cond.prediction_method
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	14 #if str($prediction_method_cond.prediction_method) == 'estscan':
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	15 --score_matrices '$score_matrices'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	16 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	17 #if str($options_type.options_type_selector) == 'advanced':
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	18 #set target_gene_family_assembly_cond = $options_type.target_gene_family_assembly_cond
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	19 #if str($target_gene_family_assembly_cond.target_gene_family_assembly) == 'yes':
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	20 --gene_family_search '$target_gene_family_assembly_cond.orthogroups'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	21 --scaffold '$target_gene_family_assembly_cond.scaffold.fields.path'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	22 --method '$target_gene_family_assembly_cond.method'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	23 --gap_trimming $target_gene_family_assembly_cond.gap_trimming
92 55024e4d84d4 Uploaded greg parents: 91 diff changeset	24 #if str($target_gene_family_assembly_cond.min_coverage) != '0.0':
91 a9571ff827b4 Uploaded greg parents: 90 diff changeset	25 --min_coverage $target_gene_family_assembly_cond.min_coverage
a9571ff827b4 Uploaded greg parents: 90 diff changeset	26 #end if
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	27 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	28 #if str($options_type.strand_specific) == 'yes':
93 c58892e1a388 Uploaded greg parents: 92 diff changeset	29 --strand_specific
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	30 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	31 #if str($options_type.dereplicate) == 'yes':
93 c58892e1a388 Uploaded greg parents: 92 diff changeset	32 --dereplicate
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	33 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	34 --min_length $options_type.min_length
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	35 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	36 --num_threads \${GALAXY_SLOTS:-4}
96 11e85af74c7e Uploaded greg parents: 95 diff changeset	37 &>proc.log
11e85af74c7e Uploaded greg parents: 95 diff changeset	38 && mv $output_dir/transcripts.cds '$output_cds'
11e85af74c7e Uploaded greg parents: 95 diff changeset	39 && mv $output_dir/transcripts.pep '$output_pep'
11e85af74c7e Uploaded greg parents: 95 diff changeset	40 && mv $output_dir/transcripts.cleaned.cds '$output_cleaned_cds'
11e85af74c7e Uploaded greg parents: 95 diff changeset	41 && mv $output_dir/transcripts.cleaned.pep '$output_cleaned_pep'
86 126430ebebf7 Uploaded greg parents: 85 diff changeset	42 #if str($options_type.options_type_selector) == 'advanced':
126430ebebf7 Uploaded greg parents: 85 diff changeset	43 #if str($target_gene_family_assembly_cond.target_gene_family_assembly) == 'yes':
96 11e85af74c7e Uploaded greg parents: 95 diff changeset	44 && if [ -f $output_dir/targeted_gene_family_assemblies.stats ]; then
11e85af74c7e Uploaded greg parents: 95 diff changeset	45 mv $output_dir/targeted_gene_family_assemblies.stats '$output_targeted_gene_families_stats'
11e85af74c7e Uploaded greg parents: 95 diff changeset	46 fi
86 126430ebebf7 Uploaded greg parents: 85 diff changeset	47 #end if
126430ebebf7 Uploaded greg parents: 85 diff changeset	48 #if str($options_type.dereplicate) == 'yes':
96 11e85af74c7e Uploaded greg parents: 95 diff changeset	49 && if [ -f $output_dir/transcripts.cleaned.nr.cds ]; then
11e85af74c7e Uploaded greg parents: 95 diff changeset	50 mv $output_dir/transcripts.cleaned.nr.cds '$output_cleaned_nr_cds'
11e85af74c7e Uploaded greg parents: 95 diff changeset	51 fi
11e85af74c7e Uploaded greg parents: 95 diff changeset	52 && if [ -f $output_dir/transcripts.cleaned.nr.pep ]; then
11e85af74c7e Uploaded greg parents: 95 diff changeset	53 mv $output_dir/transcripts.cleaned.nr.pep '$output_cleaned_nr_pep'
11e85af74c7e Uploaded greg parents: 95 diff changeset	54 fi
86 126430ebebf7 Uploaded greg parents: 85 diff changeset	55 #end if
126430ebebf7 Uploaded greg parents: 85 diff changeset	56 #end if
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	57 ]]></command>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	58 <inputs>
28 eda72de47171 Uploaded greg parents: 27 diff changeset	59 <param name="input" format="fasta" type="data" label="Transcriptome assembly fasta file"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	60 <conditional name="prediction_method_cond">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	61 <param name="prediction_method" type="select" label="Coding regions prediction method">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	62 <option value="transdecoder" selected="true">TransDecoder</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	63 <option value="estscan">ESTScan</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	64 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	65 <when value="transdecoder" />
cecea7fdccf8 Uploaded greg parents: diff changeset	66 <when value="estscan">
cecea7fdccf8 Uploaded greg parents: diff changeset	67 <param name="score_matrices" format="smat" type="data" label="Scores matrices"/>
cecea7fdccf8 Uploaded greg parents: diff changeset	68 </when>
cecea7fdccf8 Uploaded greg parents: diff changeset	69 </conditional>
cecea7fdccf8 Uploaded greg parents: diff changeset	70 <conditional name="options_type">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	71 <param name="options_type_selector" type="select" label="Options configuration">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	72 <option value="basic" selected="true">Basic</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	73 <option value="advanced">Advanced</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	74 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	75 <when value="basic" />
cecea7fdccf8 Uploaded greg parents: diff changeset	76 <when value="advanced">
cecea7fdccf8 Uploaded greg parents: diff changeset	77 <conditional name="target_gene_family_assembly_cond">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	78 <param name="target_gene_family_assembly" type="select" label="Perform targeted gene assembly?">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	79 <option value="no" selected="true">No</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	80 <option value="yes">Yes</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	81 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	82 <when value="no" />
cecea7fdccf8 Uploaded greg parents: diff changeset	83 <when value="yes">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	84 <param name="orthogroups" format="tabular" type="data" label="Targeted gene families"/>
33 0a292e319d0c Uploaded greg parents: 32 diff changeset	85 <param name="scaffold" type="select" label="Gene family scaffold">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	86 <options from_data_table="plant_tribes_scaffolds" />
10 db0c2baf176f Uploaded greg parents: 9 diff changeset	87 <validator type="no_options" message="No PlantTribes scaffolds are available. Use the PlantTribes Scaffolds Download Data Manager tool in Galaxy to install and populate the PlantTribes scaffolds data table."/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	88 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	89 <param name="method" type="select" label="Protein clustering method">
cecea7fdccf8 Uploaded greg parents: diff changeset	90 <option value="gfam" selected="true">GFam</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	91 <option value="orthofinder">OrthoFinder</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	92 <option value="orthomcl">OrthoMCL</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	93 </param>
39 b0ea1e985a38 Uploaded greg parents: 38 diff changeset	94 <param name="gap_trimming" type="float" value="0.1" min="0" max="1.0" label="Trim alignments"/>
90 7dc44a577c88 Uploaded greg parents: 89 diff changeset	95 <param name="min_coverage" type="float" value="0" min="0" max="1.0" label="Minimum alignment coverage"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	96 </when>
cecea7fdccf8 Uploaded greg parents: diff changeset	97 </conditional>
28 eda72de47171 Uploaded greg parents: 27 diff changeset	98 <param name="strand_specific" type="select" label="Strand-specific assembly?">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	99 <option value="no" selected="true">No</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	100 <option value="yes">Yes</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	101 </param>
28 eda72de47171 Uploaded greg parents: 27 diff changeset	102 <param name="dereplicate" type="select" label="Remove duplicate sequences?">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	103 <option value="no" selected="true">No</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	104 <option value="yes">Yes</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	105 </param>
28 eda72de47171 Uploaded greg parents: 27 diff changeset	106 <param name="min_length" type="integer" value="200" label="Minimum sequence length"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	107 </when>
cecea7fdccf8 Uploaded greg parents: diff changeset	108 </conditional>
cecea7fdccf8 Uploaded greg parents: diff changeset	109 </inputs>
cecea7fdccf8 Uploaded greg parents: diff changeset	110 <outputs>
84 b1102f939fdd Uploaded greg parents: 82 diff changeset	111 <data name="output_targeted_gene_families_stats" format="tabular" label="Targeted gene families statistics: ${tool.name} on ${on_string}">
b1102f939fdd Uploaded greg parents: 82 diff changeset	112 <filter>options_type['options_type_selector'] == 'advanced' and options_type['target_gene_family_assembly_cond']['target_gene_family_assembly'] == 'yes'</filter>
b1102f939fdd Uploaded greg parents: 82 diff changeset	113 </data>
80 32382b0d5add Uploaded greg parents: 78 diff changeset	114 <collection name="output_targeted_gene_families" type="list" label="Targeted gene families: ${tool.name} on ${on_string}">
82 8378d126347a Uploaded greg parents: 80 diff changeset	115 <discover_datasets pattern="__name__" directory="assemblyPostProcessing_dir/targeted_gene_family_assemblies" format="fasta" />
62 9eabe9e58fb5 Uploaded greg parents: 61 diff changeset	116 <filter>options_type['options_type_selector'] == 'advanced' and options_type['target_gene_family_assembly_cond']['target_gene_family_assembly'] == 'yes'</filter>
80 32382b0d5add Uploaded greg parents: 78 diff changeset	117 </collection>
68 338dfc33b7a7 Uploaded greg parents: 67 diff changeset	118 <data name="output_pep" format="fasta" label="transcripts.pep: ${tool.name} on ${on_string}"/>
338dfc33b7a7 Uploaded greg parents: 67 diff changeset	119 <data name="output_cleaned_pep" format="fasta" label="transcripts.cleaned.pep: ${tool.name} on ${on_string}"/>
338dfc33b7a7 Uploaded greg parents: 67 diff changeset	120 <data name="output_cleaned_nr_pep" format="fasta" label="transcripts.cleaned.nr.pep: ${tool.name} on ${on_string}">
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	121 <filter>options_type['options_type_selector'] == 'advanced' and options_type['dereplicate'] == 'yes'</filter>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	122 </data>
68 338dfc33b7a7 Uploaded greg parents: 67 diff changeset	123 <data name="output_cleaned_nr_cds" format="fasta" label="transcripts.cleaned.nr.cds: ${tool.name} on ${on_string}">
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	124 <filter>options_type['options_type_selector'] == 'advanced' and options_type['dereplicate'] == 'yes'</filter>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	125 </data>
68 338dfc33b7a7 Uploaded greg parents: 67 diff changeset	126 <data name="output_cleaned_cds" format="fasta" label="transcripts.cleaned.cds: ${tool.name} on ${on_string}"/>
338dfc33b7a7 Uploaded greg parents: 67 diff changeset	127 <data name="output_cds" format="fasta" label="transcripts.cds: ${tool.name} on ${on_string}"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	128 </outputs>
cecea7fdccf8 Uploaded greg parents: diff changeset	129 <tests>
cecea7fdccf8 Uploaded greg parents: diff changeset	130 <test>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	131 <param name="input" value="assembly.fasta" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	132 <param name="prediction_method" value="transdecoder"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	133 <output name="output_cds" file="transcripts.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	134 <output name="output_cleaned_cds" file="transcripts.cleaned.cds" ftype="fasta"/>
69 61f9552be416 Uploaded greg parents: 68 diff changeset	135 <output name="output_cleaned_pep" file="transcripts.cleaned.pep" ftype="fasta"/>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	136 <output name="output_pep" file="transcripts.pep" ftype="fasta"/>
6 bf355f832557 Uploaded greg parents: 5 diff changeset	137 </test>
bf355f832557 Uploaded greg parents: 5 diff changeset	138 <test>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	139 <param name="input" value="assembly.fasta" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	140 <param name="prediction_method" value="estscan"/>
55 5c221f721b95 Uploaded greg parents: 48 diff changeset	141 <param name="score_matrices" value="arabidopsis_thaliana.smat" ftype="smat"/>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	142 <param name="options_type_selector" value="advanced"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	143 <param name="dereplicate" value="yes"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	144 <output name="output_cds" file="transcripts2.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	145 <output name="output_cleaned_cds" file="transcripts.cleaned.nr.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	146 <output name="output_cleaned_nr_cds" file="transcripts.cleaned.nr.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	147 <output name="output_cleaned_nr_pep" file="transcripts.cleaned.nr.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	148 <output name="output_cleaned_pep" file="transcripts.cleaned.nr.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	149 <output name="output_pep" file="transcripts2.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	150 </test>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	151 <test>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	152 <param name="input" value="assembly_tgf.fasta" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	153 <param name="prediction_method" value="transdecoder"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	154 <param name="options_type_selector" value="advanced"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	155 <param name="target_gene_family_assembly" value="yes"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	156 <param name="orthogroups" value="target_orthos.ids"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	157 <param name="scaffold" value="22Gv1.1"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	158 <param name="method" value="orthomcl"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	159 <param name="dereplicate" value="yes"/>
82 8378d126347a Uploaded greg parents: 80 diff changeset	160 <output_collection name="output_targeted_gene_families" type="list">
8378d126347a Uploaded greg parents: 80 diff changeset	161 <element name="752.faa" file="752.faa" ftype="fasta"/>
8378d126347a Uploaded greg parents: 80 diff changeset	162 <element name="752.fasta" file="752.fasta" ftype="fasta"/>
8378d126347a Uploaded greg parents: 80 diff changeset	163 <element name="752.fna" file="752.fna" ftype="fasta"/>
8378d126347a Uploaded greg parents: 80 diff changeset	164 </output_collection>
85 b5aac0d2c99c Uploaded greg parents: 84 diff changeset	165 <output name="output_targeted_gene_families_stats" file="output_targeted_gene_families_stats.tabular" ftype="tabular"/>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	166 <output name="output_cds" file="transcripts_tgf.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	167 <output name="output_cleaned_cds" file="transcripts.cleaned_tgf.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	168 <output name="output_cleaned_nr_cds" file="transcripts_tgf.cleaned.nr.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	169 <output name="output_cleaned_nr_pep" file="transcripts_tgf.cleaned.nr.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	170 <output name="output_cleaned_pep" file="transcripts.cleaned_tgf.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	171 <output name="output_pep" file="transcripts_tgf.pep" ftype="fasta"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	172 </test>
cecea7fdccf8 Uploaded greg parents: diff changeset	173 </tests>
cecea7fdccf8 Uploaded greg parents: diff changeset	174 <help>
33 0a292e319d0c Uploaded greg parents: 32 diff changeset	175 This tool is one of the PlantTribes collection of automated modular analysis pipelines for comparative and
28 eda72de47171 Uploaded greg parents: 27 diff changeset	176 evolutionary analyses of genome-scale gene families and transcriptomes. This tool post-processes de novo
eda72de47171 Uploaded greg parents: 27 diff changeset	177 assembled transcripts into putative coding sequences and their corresponding amino acid translations and
eda72de47171 Uploaded greg parents: 27 diff changeset	178 optionally assigns transcripts to circumscribed gene families ("orthogroups")[2]. After transcripts have been
eda72de47171 Uploaded greg parents: 27 diff changeset	179 assigned to gene families, overlapping contigs can be identified and merged to reduce fragmentation in the
eda72de47171 Uploaded greg parents: 27 diff changeset	180 de novo assembly.
0 cecea7fdccf8 Uploaded greg parents: diff changeset	181
cecea7fdccf8 Uploaded greg parents: diff changeset	182 -----
cecea7fdccf8 Uploaded greg parents: diff changeset	183
28 eda72de47171 Uploaded greg parents: 27 diff changeset	184 Required options
eda72de47171 Uploaded greg parents: 27 diff changeset	185
eda72de47171 Uploaded greg parents: 27 diff changeset	186 * Transcriptome assembly fasta file - either de novo or reference-guided transcriptome assembly fasta file selected from your history.
33 0a292e319d0c Uploaded greg parents: 32 diff changeset	187 * Coding regions prediction method - method for finding coding regions within transcripts. Available methods are TransDecoder[3] and ESTScan[4].
0a292e319d0c Uploaded greg parents: 32 diff changeset	188 * Scores matrices - scores matrices, based on a related species, are required when ESTScan is used to find coding regions. Details of how to create species-specific scores matrices can be found on the ESTScan website (http://estscan.sourceforge.net). Matrices of some organisms are also available to download.
28 eda72de47171 Uploaded greg parents: 27 diff changeset	189
eda72de47171 Uploaded greg parents: 27 diff changeset	190 Other options
0 cecea7fdccf8 Uploaded greg parents: diff changeset	191
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	192 * Perform targeted gene assembly? - selecting 'Yes' enables local assembly of one or more targeted gene families in a specific scaffold. Scaffolds are defined in PlantTribes as clusters of paralogous/orthologous sequences from a specified set of proteomes[5-7].
35 2d4590d05b29 Uploaded greg parents: 34 diff changeset	193
84 b1102f939fdd Uploaded greg parents: 82 diff changeset	194 * Targeted gene families - select a history item containing a list of targeted orthogroup identifiers corresponding to the gene family classification from a specified scaffold. Gene family identifiers can be obtained from the function annotation table ("Orthogroup ID" field of .summary file) of scaffold data installed into Galaxy via the PlantTribes Scaffolds Download Data Manager tool, and are also available in the PlantTribes "annotation" directory of the scaffold data download.
35 2d4590d05b29 Uploaded greg parents: 34 diff changeset	195 * Gene family scaffold - one of the PlantTribes gene family scaffolds (installed into Galaxy by the PlantTribes Scaffolds Download Data Manager tool) whose orthogroup(s) are targeted for the localized assembly.
2d4590d05b29 Uploaded greg parents: 34 diff changeset	196 * Protein clustering method - gene family scaffold protein clustering method. Each PlantTribes scaffold data has up to three sets of clusters - GFam[8] (clusters of consensus domain architecture), OrthoFinder[9] (broadly defined clusters) or OrthoMCL[10] (narrowly defined clusters). You can also install your own data scaffold created using a different clustering method as long as it conforms to the PlantTribes scaffold data format.
39 b0ea1e985a38 Uploaded greg parents: 38 diff changeset	197 * Trim alignments - trim gene family multiple sequence alignments that include scaffold backbone genes and locally assembled transcripts to remove non-conserved regions (gappy sites)[11]. The trimmed alignments are used in assigning scores to locally assembled transcripts to determine how well they compare to the backbone gene models. The default setting of 0.1 removes sites that have gaps in 90% or more of the sequences in the multiple sequence alignment. This option is restricted to the range 0.0 - 1.0.
90 7dc44a577c88 Uploaded greg parents: 89 diff changeset	198 * Minimum alignment coverage - allowable sequence coverage in the orthogroup trimmed protein multiple sequence alignments. Selecting transcripts with coverage of at least the average of the backbone orthogroup gene models is recommended. Details are shown in the targeted gene family assembly statistics history item.
35 2d4590d05b29 Uploaded greg parents: 34 diff changeset	199
28 eda72de47171 Uploaded greg parents: 27 diff changeset	200 * Strand-specific assembly? - select 'Yes' if transcriptome library sequences were strand-specific. If 'Yes" is selected, transcripts from the minority strand (antisense) are removed.
eda72de47171 Uploaded greg parents: 27 diff changeset	201 * Remove duplicate sequences? - select 'Yes' to remove duplicated and exact subsequences[12].
eda72de47171 Uploaded greg parents: 27 diff changeset	202 * Minimum sequence length - set the minimum sequence length of predicted coding regions. The default is 200 bp.
31 0fad708a9693 Uploaded greg parents: 30 diff changeset	203
0 cecea7fdccf8 Uploaded greg parents: diff changeset	204 </help>
cecea7fdccf8 Uploaded greg parents: diff changeset	205 <citations>
37 cc4dba9f6ecd Uploaded greg parents: 36 diff changeset	206 <expand macro="citation1" />
28 eda72de47171 Uploaded greg parents: 27 diff changeset	207 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	208 @article{Honaas2016,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	209 journal = {PloS one},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	210 author = {2. Honaas LA, Wafula EK, Wickett NJ, Der JP, Zhang Y, Edger PP, Altman NS, Pires JC, Leebens-Mack JH},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	211 title = {Selecting superior de novo transcriptome assemblies: lessons learned by leveraging the best plant genome},
eda72de47171 Uploaded greg parents: 27 diff changeset	212 year = {2016},
eda72de47171 Uploaded greg parents: 27 diff changeset	213 volume = {11},
eda72de47171 Uploaded greg parents: 27 diff changeset	214 number = {1},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	215 pages = {e0146062},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	216 </citation>
24 a39def7197cf Uploaded greg parents: 23 diff changeset	217 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	218 @article{Haas2013,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	219 journal = {Nature Protocols},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	220 author = {3. Haas BJ, Papanicolaou A, Yassour M, Grabherr M, Blood PD, Bowden J, Couger MB, Eccles D, Li B, Lieber M, MacManes MD},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	221 title = {De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis},
eda72de47171 Uploaded greg parents: 27 diff changeset	222 year = {2013},
eda72de47171 Uploaded greg parents: 27 diff changeset	223 volume = {8},
eda72de47171 Uploaded greg parents: 27 diff changeset	224 number = {8},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	225 pages = {1494-1512},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	226 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	227 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	228 @article{Iseli1999,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	229 journal = {ISMB},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	230 author = {4. Iseli C, Jongeneel CV, Bucher P},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	231 title = {ESTScan: a program for detecting, evaluating, and reconstructing potential coding regions in EST sequences},
24 a39def7197cf Uploaded greg parents: 23 diff changeset	232 year = {1999},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	233 volume = {99},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	234 pages = {138-148},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	235 url = {http://estscan.sourceforge.net},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	236 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	237 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	238 @article{Huang1999,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	239 journal = {Genome Research},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	240 author = {5. Huang X, Madan A},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	241 title = {CAP3: A DNA sequence assembly program},
eda72de47171 Uploaded greg parents: 27 diff changeset	242 year = {1999},
eda72de47171 Uploaded greg parents: 27 diff changeset	243 volume = {9},
eda72de47171 Uploaded greg parents: 27 diff changeset	244 number = {9},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	245 pages = {868-877},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	246 url = {http://seq.cs.iastate.edu/cap3.html},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	247 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	248 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	249 @article{Eddy2009,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	250 journal = {Genome Inform},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	251 author = {6. Eddy SR},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	252 title = {A new generation of homology search tools based on probabilistic inference},
eda72de47171 Uploaded greg parents: 27 diff changeset	253 year = {2009},
eda72de47171 Uploaded greg parents: 27 diff changeset	254 volume = {23},
eda72de47171 Uploaded greg parents: 27 diff changeset	255 number = {1},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	256 pages = {205-211},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	257 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	258 <citation type="bibtex">
30 0d680d17278c Uploaded greg parents: 29 diff changeset	259 @article{Katoh2013,
0d680d17278c Uploaded greg parents: 29 diff changeset	260 journal = {Molecular biology and evolution},
0d680d17278c Uploaded greg parents: 29 diff changeset	261 author = {7. Katoh K, Standley DM},
0d680d17278c Uploaded greg parents: 29 diff changeset	262 title = {MAFFT multiple sequence alignment software version 7: improvements in performance and usability},
0d680d17278c Uploaded greg parents: 29 diff changeset	263 year = {2013},
0d680d17278c Uploaded greg parents: 29 diff changeset	264 volume = {30},
0d680d17278c Uploaded greg parents: 29 diff changeset	265 number = {4},
0d680d17278c Uploaded greg parents: 29 diff changeset	266 pages = {772-780},}
0d680d17278c Uploaded greg parents: 29 diff changeset	267 </citation>
0d680d17278c Uploaded greg parents: 29 diff changeset	268 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	269 @article{Sasidharan2012,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	270 journal = {Nucleic Acids Research},
30 0d680d17278c Uploaded greg parents: 29 diff changeset	271 author = {8. Sasidharan R, Nepusz T, Swarbreck D, Huala E, Paccanaro A},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	272 title = {GFam: a platform for automatic annotation of gene families},
eda72de47171 Uploaded greg parents: 27 diff changeset	273 year = {2012},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	274 pages = {gks631},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	275 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	276 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	277 @article{Li2003,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	278 journal = {Genome Research}
30 0d680d17278c Uploaded greg parents: 29 diff changeset	279 author = {9. Li L, Stoeckert CJ, Roos DS},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	280 title = {OrthoMCL: identification of ortholog groups for eukaryotic genomes},
eda72de47171 Uploaded greg parents: 27 diff changeset	281 year = {2003},
eda72de47171 Uploaded greg parents: 27 diff changeset	282 volume = {13},
eda72de47171 Uploaded greg parents: 27 diff changeset	283 number = {9},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	284 pages = {2178-2189},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	285 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	286 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	287 @article{Emms2015,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	288 journal = {Genome Biology}
30 0d680d17278c Uploaded greg parents: 29 diff changeset	289 author = {10. Emms DM, Kelly S},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	290 title = {OrthoFinder: solving fundamental biases in whole genome comparisons dramatically improves orthogroup inference accuracy},
eda72de47171 Uploaded greg parents: 27 diff changeset	291 year = {2015},
eda72de47171 Uploaded greg parents: 27 diff changeset	292 volume = {16},
eda72de47171 Uploaded greg parents: 27 diff changeset	293 number = {1},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	294 pages = {157},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	295 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	296 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	297 @article{Capella-Gutierrez2009,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	298 journal = {Bioinformatics,},
30 0d680d17278c Uploaded greg parents: 29 diff changeset	299 author = {11. Capella-Gutierrez S, Silla-Martínez JM, Gabaldón T},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	300 title = {trimAl: a tool for automated alignment trimming in large-scale phylogenetic analyses},
eda72de47171 Uploaded greg parents: 27 diff changeset	301 year = {2009},
eda72de47171 Uploaded greg parents: 27 diff changeset	302 volume = {25},
eda72de47171 Uploaded greg parents: 27 diff changeset	303 number = {15},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	304 pages = {1972-1973},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	305 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	306 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	307 @article{Gremme2013,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	308 journal = {IEEE/ACM Transactions on Computational Biology and Bioinformatics},
30 0d680d17278c Uploaded greg parents: 29 diff changeset	309 author = {12. Gremme G, Steinbiss S, Kurtz S},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	310 title = {GenomeTools: a comprehensive software library for efficient processing of structured genome annotations},
eda72de47171 Uploaded greg parents: 27 diff changeset	311 year = {2013},
eda72de47171 Uploaded greg parents: 27 diff changeset	312 volume = {10},
eda72de47171 Uploaded greg parents: 27 diff changeset	313 number = {3},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	314 pages = {645-656},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	315 </citation>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	316 </citations>
cecea7fdccf8 Uploaded greg parents: diff changeset	317 </tool>

Mercurial > repos > greg > assembly_post_processor

annotate assembly_post_processor.xml @ 96:11e85af74c7e draft