assembly_post_processor: assembly_post

annotate assembly_post_processor.xml @ 92:55024e4d84d4 draft

Uploaded

author	greg
date	Thu, 26 Oct 2017 09:22:59 -0400
parents	a9571ff827b4
children	c58892e1a388

rev	line source
74 9da5dc4b99cc Uploaded greg parents: 73 diff changeset	1 <tool id="plant_tribes_assembly_post_processor" name="AssemblyPostProcessor" version="@WRAPPER_VERSION@.3.0">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	2 <description>post-processes de novo transcriptome assembly</description>
37 cc4dba9f6ecd Uploaded greg parents: 36 diff changeset	3 <macros>
cc4dba9f6ecd Uploaded greg parents: 36 diff changeset	4 <import>macros.xml</import>
cc4dba9f6ecd Uploaded greg parents: 36 diff changeset	5 </macros>
74 9da5dc4b99cc Uploaded greg parents: 73 diff changeset	6 <requirements>
9da5dc4b99cc Uploaded greg parents: 73 diff changeset	7 <requirement type="package" version="1.0.3">plant_tribes_assembly_post_processor</requirement>
9da5dc4b99cc Uploaded greg parents: 73 diff changeset	8 </requirements>
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	9 <command detect_errors="exit_code"><![CDATA[
86 126430ebebf7 Uploaded greg parents: 85 diff changeset	10 #set output_dir = 'assemblyPostProcessing_dir'
126430ebebf7 Uploaded greg parents: 85 diff changeset	11 AssemblyPostProcessor
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	12 --transcripts '$input'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	13 --prediction_method $prediction_method_cond.prediction_method
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	14 #if str($prediction_method_cond.prediction_method) == 'estscan':
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	15 --score_matrices '$score_matrices'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	16 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	17 #if str($options_type.options_type_selector) == 'advanced':
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	18 #set target_gene_family_assembly_cond = $options_type.target_gene_family_assembly_cond
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	19 #if str($target_gene_family_assembly_cond.target_gene_family_assembly) == 'yes':
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	20 --gene_family_search '$target_gene_family_assembly_cond.orthogroups'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	21 --scaffold '$target_gene_family_assembly_cond.scaffold.fields.path'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	22 --method '$target_gene_family_assembly_cond.method'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	23 --gap_trimming $target_gene_family_assembly_cond.gap_trimming
92 55024e4d84d4 Uploaded greg parents: 91 diff changeset	24 #if str($target_gene_family_assembly_cond.min_coverage) != '0.0':
91 a9571ff827b4 Uploaded greg parents: 90 diff changeset	25 --min_coverage $target_gene_family_assembly_cond.min_coverage
a9571ff827b4 Uploaded greg parents: 90 diff changeset	26 #end if
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	27 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	28 #if str($options_type.strand_specific) == 'yes':
72 b3d4fd21506d Uploaded greg parents: 71 diff changeset	29 --strand_specific true
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	30 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	31 #if str($options_type.dereplicate) == 'yes':
72 b3d4fd21506d Uploaded greg parents: 71 diff changeset	32 --dereplicate true
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	33 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	34 --min_length $options_type.min_length
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	35 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	36 --num_threads \${GALAXY_SLOTS:-4}
90 7dc44a577c88 Uploaded greg parents: 89 diff changeset	37 &>proc.log
86 126430ebebf7 Uploaded greg parents: 85 diff changeset	38 && mv $output_dir/transcripts.cds '$output_cds'
126430ebebf7 Uploaded greg parents: 85 diff changeset	39 && mv $output_dir/transcripts.pep '$output_pep'
126430ebebf7 Uploaded greg parents: 85 diff changeset	40 && mv $output_dir/transcripts.cleaned.cds '$output_cleaned_cds'
126430ebebf7 Uploaded greg parents: 85 diff changeset	41 && mv $output_dir/transcripts.cleaned.pep '$output_cleaned_pep'
126430ebebf7 Uploaded greg parents: 85 diff changeset	42 #if str($options_type.options_type_selector) == 'advanced':
126430ebebf7 Uploaded greg parents: 85 diff changeset	43 #if str($target_gene_family_assembly_cond.target_gene_family_assembly) == 'yes':
126430ebebf7 Uploaded greg parents: 85 diff changeset	44 && mv $output_dir/targeted_gene_family_assemblies.stats '$output_targeted_gene_families_stats'
126430ebebf7 Uploaded greg parents: 85 diff changeset	45 #end if
126430ebebf7 Uploaded greg parents: 85 diff changeset	46 #if str($options_type.dereplicate) == 'yes':
126430ebebf7 Uploaded greg parents: 85 diff changeset	47 && mv $output_dir/transcripts.cleaned.nr.cds '$output_cleaned_nr_cds'
126430ebebf7 Uploaded greg parents: 85 diff changeset	48 && mv $output_dir/transcripts.cleaned.nr.pep '$output_cleaned_nr_pep'
126430ebebf7 Uploaded greg parents: 85 diff changeset	49 #end if
126430ebebf7 Uploaded greg parents: 85 diff changeset	50 #end if
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	51 ]]></command>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	52 <inputs>
28 eda72de47171 Uploaded greg parents: 27 diff changeset	53 <param name="input" format="fasta" type="data" label="Transcriptome assembly fasta file"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	54 <conditional name="prediction_method_cond">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	55 <param name="prediction_method" type="select" label="Coding regions prediction method">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	56 <option value="transdecoder" selected="true">TransDecoder</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	57 <option value="estscan">ESTScan</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	58 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	59 <when value="transdecoder" />
cecea7fdccf8 Uploaded greg parents: diff changeset	60 <when value="estscan">
cecea7fdccf8 Uploaded greg parents: diff changeset	61 <param name="score_matrices" format="smat" type="data" label="Scores matrices"/>
cecea7fdccf8 Uploaded greg parents: diff changeset	62 </when>
cecea7fdccf8 Uploaded greg parents: diff changeset	63 </conditional>
cecea7fdccf8 Uploaded greg parents: diff changeset	64 <conditional name="options_type">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	65 <param name="options_type_selector" type="select" label="Options configuration">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	66 <option value="basic" selected="true">Basic</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	67 <option value="advanced">Advanced</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	68 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	69 <when value="basic" />
cecea7fdccf8 Uploaded greg parents: diff changeset	70 <when value="advanced">
cecea7fdccf8 Uploaded greg parents: diff changeset	71 <conditional name="target_gene_family_assembly_cond">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	72 <param name="target_gene_family_assembly" type="select" label="Perform targeted gene assembly?">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	73 <option value="no" selected="true">No</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	74 <option value="yes">Yes</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	75 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	76 <when value="no" />
cecea7fdccf8 Uploaded greg parents: diff changeset	77 <when value="yes">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	78 <param name="orthogroups" format="tabular" type="data" label="Targeted gene families"/>
33 0a292e319d0c Uploaded greg parents: 32 diff changeset	79 <param name="scaffold" type="select" label="Gene family scaffold">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	80 <options from_data_table="plant_tribes_scaffolds" />
10 db0c2baf176f Uploaded greg parents: 9 diff changeset	81 <validator type="no_options" message="No PlantTribes scaffolds are available. Use the PlantTribes Scaffolds Download Data Manager tool in Galaxy to install and populate the PlantTribes scaffolds data table."/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	82 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	83 <param name="method" type="select" label="Protein clustering method">
cecea7fdccf8 Uploaded greg parents: diff changeset	84 <option value="gfam" selected="true">GFam</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	85 <option value="orthofinder">OrthoFinder</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	86 <option value="orthomcl">OrthoMCL</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	87 </param>
39 b0ea1e985a38 Uploaded greg parents: 38 diff changeset	88 <param name="gap_trimming" type="float" value="0.1" min="0" max="1.0" label="Trim alignments"/>
90 7dc44a577c88 Uploaded greg parents: 89 diff changeset	89 <param name="min_coverage" type="float" value="0" min="0" max="1.0" label="Minimum alignment coverage"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	90 </when>
cecea7fdccf8 Uploaded greg parents: diff changeset	91 </conditional>
28 eda72de47171 Uploaded greg parents: 27 diff changeset	92 <param name="strand_specific" type="select" label="Strand-specific assembly?">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	93 <option value="no" selected="true">No</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	94 <option value="yes">Yes</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	95 </param>
28 eda72de47171 Uploaded greg parents: 27 diff changeset	96 <param name="dereplicate" type="select" label="Remove duplicate sequences?">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	97 <option value="no" selected="true">No</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	98 <option value="yes">Yes</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	99 </param>
28 eda72de47171 Uploaded greg parents: 27 diff changeset	100 <param name="min_length" type="integer" value="200" label="Minimum sequence length"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	101 </when>
cecea7fdccf8 Uploaded greg parents: diff changeset	102 </conditional>
cecea7fdccf8 Uploaded greg parents: diff changeset	103 </inputs>
cecea7fdccf8 Uploaded greg parents: diff changeset	104 <outputs>
84 b1102f939fdd Uploaded greg parents: 82 diff changeset	105 <data name="output_targeted_gene_families_stats" format="tabular" label="Targeted gene families statistics: ${tool.name} on ${on_string}">
b1102f939fdd Uploaded greg parents: 82 diff changeset	106 <filter>options_type['options_type_selector'] == 'advanced' and options_type['target_gene_family_assembly_cond']['target_gene_family_assembly'] == 'yes'</filter>
b1102f939fdd Uploaded greg parents: 82 diff changeset	107 </data>
80 32382b0d5add Uploaded greg parents: 78 diff changeset	108 <collection name="output_targeted_gene_families" type="list" label="Targeted gene families: ${tool.name} on ${on_string}">
82 8378d126347a Uploaded greg parents: 80 diff changeset	109 <discover_datasets pattern="__name__" directory="assemblyPostProcessing_dir/targeted_gene_family_assemblies" format="fasta" />
62 9eabe9e58fb5 Uploaded greg parents: 61 diff changeset	110 <filter>options_type['options_type_selector'] == 'advanced' and options_type['target_gene_family_assembly_cond']['target_gene_family_assembly'] == 'yes'</filter>
80 32382b0d5add Uploaded greg parents: 78 diff changeset	111 </collection>
68 338dfc33b7a7 Uploaded greg parents: 67 diff changeset	112 <data name="output_pep" format="fasta" label="transcripts.pep: ${tool.name} on ${on_string}"/>
338dfc33b7a7 Uploaded greg parents: 67 diff changeset	113 <data name="output_cleaned_pep" format="fasta" label="transcripts.cleaned.pep: ${tool.name} on ${on_string}"/>
338dfc33b7a7 Uploaded greg parents: 67 diff changeset	114 <data name="output_cleaned_nr_pep" format="fasta" label="transcripts.cleaned.nr.pep: ${tool.name} on ${on_string}">
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	115 <filter>options_type['options_type_selector'] == 'advanced' and options_type['dereplicate'] == 'yes'</filter>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	116 </data>
68 338dfc33b7a7 Uploaded greg parents: 67 diff changeset	117 <data name="output_cleaned_nr_cds" format="fasta" label="transcripts.cleaned.nr.cds: ${tool.name} on ${on_string}">
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	118 <filter>options_type['options_type_selector'] == 'advanced' and options_type['dereplicate'] == 'yes'</filter>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	119 </data>
68 338dfc33b7a7 Uploaded greg parents: 67 diff changeset	120 <data name="output_cleaned_cds" format="fasta" label="transcripts.cleaned.cds: ${tool.name} on ${on_string}"/>
338dfc33b7a7 Uploaded greg parents: 67 diff changeset	121 <data name="output_cds" format="fasta" label="transcripts.cds: ${tool.name} on ${on_string}"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	122 </outputs>
cecea7fdccf8 Uploaded greg parents: diff changeset	123 <tests>
cecea7fdccf8 Uploaded greg parents: diff changeset	124 <test>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	125 <param name="input" value="assembly.fasta" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	126 <param name="prediction_method" value="transdecoder"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	127 <output name="output_cds" file="transcripts.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	128 <output name="output_cleaned_cds" file="transcripts.cleaned.cds" ftype="fasta"/>
69 61f9552be416 Uploaded greg parents: 68 diff changeset	129 <output name="output_cleaned_pep" file="transcripts.cleaned.pep" ftype="fasta"/>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	130 <output name="output_pep" file="transcripts.pep" ftype="fasta"/>
6 bf355f832557 Uploaded greg parents: 5 diff changeset	131 </test>
bf355f832557 Uploaded greg parents: 5 diff changeset	132 <test>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	133 <param name="input" value="assembly.fasta" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	134 <param name="prediction_method" value="estscan"/>
55 5c221f721b95 Uploaded greg parents: 48 diff changeset	135 <param name="score_matrices" value="arabidopsis_thaliana.smat" ftype="smat"/>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	136 <param name="options_type_selector" value="advanced"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	137 <param name="dereplicate" value="yes"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	138 <output name="output_cds" file="transcripts2.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	139 <output name="output_cleaned_cds" file="transcripts.cleaned.nr.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	140 <output name="output_cleaned_nr_cds" file="transcripts.cleaned.nr.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	141 <output name="output_cleaned_nr_pep" file="transcripts.cleaned.nr.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	142 <output name="output_cleaned_pep" file="transcripts.cleaned.nr.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	143 <output name="output_pep" file="transcripts2.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	144 </test>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	145 <test>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	146 <param name="input" value="assembly_tgf.fasta" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	147 <param name="prediction_method" value="transdecoder"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	148 <param name="options_type_selector" value="advanced"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	149 <param name="target_gene_family_assembly" value="yes"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	150 <param name="orthogroups" value="target_orthos.ids"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	151 <param name="scaffold" value="22Gv1.1"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	152 <param name="method" value="orthomcl"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	153 <param name="dereplicate" value="yes"/>
82 8378d126347a Uploaded greg parents: 80 diff changeset	154 <output_collection name="output_targeted_gene_families" type="list">
8378d126347a Uploaded greg parents: 80 diff changeset	155 <element name="752.faa" file="752.faa" ftype="fasta"/>
8378d126347a Uploaded greg parents: 80 diff changeset	156 <element name="752.fasta" file="752.fasta" ftype="fasta"/>
8378d126347a Uploaded greg parents: 80 diff changeset	157 <element name="752.fna" file="752.fna" ftype="fasta"/>
8378d126347a Uploaded greg parents: 80 diff changeset	158 </output_collection>
85 b5aac0d2c99c Uploaded greg parents: 84 diff changeset	159 <output name="output_targeted_gene_families_stats" file="output_targeted_gene_families_stats.tabular" ftype="tabular"/>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	160 <output name="output_cds" file="transcripts_tgf.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	161 <output name="output_cleaned_cds" file="transcripts.cleaned_tgf.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	162 <output name="output_cleaned_nr_cds" file="transcripts_tgf.cleaned.nr.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	163 <output name="output_cleaned_nr_pep" file="transcripts_tgf.cleaned.nr.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	164 <output name="output_cleaned_pep" file="transcripts.cleaned_tgf.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	165 <output name="output_pep" file="transcripts_tgf.pep" ftype="fasta"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	166 </test>
cecea7fdccf8 Uploaded greg parents: diff changeset	167 </tests>
cecea7fdccf8 Uploaded greg parents: diff changeset	168 <help>
33 0a292e319d0c Uploaded greg parents: 32 diff changeset	169 This tool is one of the PlantTribes collection of automated modular analysis pipelines for comparative and
28 eda72de47171 Uploaded greg parents: 27 diff changeset	170 evolutionary analyses of genome-scale gene families and transcriptomes. This tool post-processes de novo
eda72de47171 Uploaded greg parents: 27 diff changeset	171 assembled transcripts into putative coding sequences and their corresponding amino acid translations and
eda72de47171 Uploaded greg parents: 27 diff changeset	172 optionally assigns transcripts to circumscribed gene families ("orthogroups")[2]. After transcripts have been
eda72de47171 Uploaded greg parents: 27 diff changeset	173 assigned to gene families, overlapping contigs can be identified and merged to reduce fragmentation in the
eda72de47171 Uploaded greg parents: 27 diff changeset	174 de novo assembly.
0 cecea7fdccf8 Uploaded greg parents: diff changeset	175
cecea7fdccf8 Uploaded greg parents: diff changeset	176 -----
cecea7fdccf8 Uploaded greg parents: diff changeset	177
28 eda72de47171 Uploaded greg parents: 27 diff changeset	178 Required options
eda72de47171 Uploaded greg parents: 27 diff changeset	179
eda72de47171 Uploaded greg parents: 27 diff changeset	180 * Transcriptome assembly fasta file - either de novo or reference-guided transcriptome assembly fasta file selected from your history.
33 0a292e319d0c Uploaded greg parents: 32 diff changeset	181 * Coding regions prediction method - method for finding coding regions within transcripts. Available methods are TransDecoder[3] and ESTScan[4].
0a292e319d0c Uploaded greg parents: 32 diff changeset	182 * Scores matrices - scores matrices, based on a related species, are required when ESTScan is used to find coding regions. Details of how to create species-specific scores matrices can be found on the ESTScan website (http://estscan.sourceforge.net). Matrices of some organisms are also available to download.
28 eda72de47171 Uploaded greg parents: 27 diff changeset	183
eda72de47171 Uploaded greg parents: 27 diff changeset	184 Other options
0 cecea7fdccf8 Uploaded greg parents: diff changeset	185
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	186 * Perform targeted gene assembly? - selecting 'Yes' enables local assembly of one or more targeted gene families in a specific scaffold. Scaffolds are defined in PlantTribes as clusters of paralogous/orthologous sequences from a specified set of proteomes[5-7].
35 2d4590d05b29 Uploaded greg parents: 34 diff changeset	187
84 b1102f939fdd Uploaded greg parents: 82 diff changeset	188 * Targeted gene families - select a history item containing a list of targeted orthogroup identifiers corresponding to the gene family classification from a specified scaffold. Gene family identifiers can be obtained from the function annotation table ("Orthogroup ID" field of .summary file) of scaffold data installed into Galaxy via the PlantTribes Scaffolds Download Data Manager tool, and are also available in the PlantTribes "annotation" directory of the scaffold data download.
35 2d4590d05b29 Uploaded greg parents: 34 diff changeset	189 * Gene family scaffold - one of the PlantTribes gene family scaffolds (installed into Galaxy by the PlantTribes Scaffolds Download Data Manager tool) whose orthogroup(s) are targeted for the localized assembly.
2d4590d05b29 Uploaded greg parents: 34 diff changeset	190 * Protein clustering method - gene family scaffold protein clustering method. Each PlantTribes scaffold data has up to three sets of clusters - GFam[8] (clusters of consensus domain architecture), OrthoFinder[9] (broadly defined clusters) or OrthoMCL[10] (narrowly defined clusters). You can also install your own data scaffold created using a different clustering method as long as it conforms to the PlantTribes scaffold data format.
39 b0ea1e985a38 Uploaded greg parents: 38 diff changeset	191 * Trim alignments - trim gene family multiple sequence alignments that include scaffold backbone genes and locally assembled transcripts to remove non-conserved regions (gappy sites)[11]. The trimmed alignments are used in assigning scores to locally assembled transcripts to determine how well they compare to the backbone gene models. The default setting of 0.1 removes sites that have gaps in 90% or more of the sequences in the multiple sequence alignment. This option is restricted to the range 0.0 - 1.0.
90 7dc44a577c88 Uploaded greg parents: 89 diff changeset	192 * Minimum alignment coverage - allowable sequence coverage in the orthogroup trimmed protein multiple sequence alignments. Selecting transcripts with coverage of at least the average of the backbone orthogroup gene models is recommended. Details are shown in the targeted gene family assembly statistics history item.
35 2d4590d05b29 Uploaded greg parents: 34 diff changeset	193
28 eda72de47171 Uploaded greg parents: 27 diff changeset	194 * Strand-specific assembly? - select 'Yes' if transcriptome library sequences were strand-specific. If 'Yes" is selected, transcripts from the minority strand (antisense) are removed.
eda72de47171 Uploaded greg parents: 27 diff changeset	195 * Remove duplicate sequences? - select 'Yes' to remove duplicated and exact subsequences[12].
eda72de47171 Uploaded greg parents: 27 diff changeset	196 * Minimum sequence length - set the minimum sequence length of predicted coding regions. The default is 200 bp.
31 0fad708a9693 Uploaded greg parents: 30 diff changeset	197
0 cecea7fdccf8 Uploaded greg parents: diff changeset	198 </help>
cecea7fdccf8 Uploaded greg parents: diff changeset	199 <citations>
37 cc4dba9f6ecd Uploaded greg parents: 36 diff changeset	200 <expand macro="citation1" />
28 eda72de47171 Uploaded greg parents: 27 diff changeset	201 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	202 @article{Honaas2016,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	203 journal = {PloS one},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	204 author = {2. Honaas LA, Wafula EK, Wickett NJ, Der JP, Zhang Y, Edger PP, Altman NS, Pires JC, Leebens-Mack JH},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	205 title = {Selecting superior de novo transcriptome assemblies: lessons learned by leveraging the best plant genome},
eda72de47171 Uploaded greg parents: 27 diff changeset	206 year = {2016},
eda72de47171 Uploaded greg parents: 27 diff changeset	207 volume = {11},
eda72de47171 Uploaded greg parents: 27 diff changeset	208 number = {1},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	209 pages = {e0146062},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	210 </citation>
24 a39def7197cf Uploaded greg parents: 23 diff changeset	211 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	212 @article{Haas2013,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	213 journal = {Nature Protocols},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	214 author = {3. Haas BJ, Papanicolaou A, Yassour M, Grabherr M, Blood PD, Bowden J, Couger MB, Eccles D, Li B, Lieber M, MacManes MD},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	215 title = {De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis},
eda72de47171 Uploaded greg parents: 27 diff changeset	216 year = {2013},
eda72de47171 Uploaded greg parents: 27 diff changeset	217 volume = {8},
eda72de47171 Uploaded greg parents: 27 diff changeset	218 number = {8},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	219 pages = {1494-1512},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	220 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	221 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	222 @article{Iseli1999,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	223 journal = {ISMB},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	224 author = {4. Iseli C, Jongeneel CV, Bucher P},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	225 title = {ESTScan: a program for detecting, evaluating, and reconstructing potential coding regions in EST sequences},
24 a39def7197cf Uploaded greg parents: 23 diff changeset	226 year = {1999},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	227 volume = {99},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	228 pages = {138-148},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	229 url = {http://estscan.sourceforge.net},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	230 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	231 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	232 @article{Huang1999,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	233 journal = {Genome Research},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	234 author = {5. Huang X, Madan A},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	235 title = {CAP3: A DNA sequence assembly program},
eda72de47171 Uploaded greg parents: 27 diff changeset	236 year = {1999},
eda72de47171 Uploaded greg parents: 27 diff changeset	237 volume = {9},
eda72de47171 Uploaded greg parents: 27 diff changeset	238 number = {9},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	239 pages = {868-877},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	240 url = {http://seq.cs.iastate.edu/cap3.html},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	241 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	242 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	243 @article{Eddy2009,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	244 journal = {Genome Inform},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	245 author = {6. Eddy SR},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	246 title = {A new generation of homology search tools based on probabilistic inference},
eda72de47171 Uploaded greg parents: 27 diff changeset	247 year = {2009},
eda72de47171 Uploaded greg parents: 27 diff changeset	248 volume = {23},
eda72de47171 Uploaded greg parents: 27 diff changeset	249 number = {1},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	250 pages = {205-211},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	251 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	252 <citation type="bibtex">
30 0d680d17278c Uploaded greg parents: 29 diff changeset	253 @article{Katoh2013,
0d680d17278c Uploaded greg parents: 29 diff changeset	254 journal = {Molecular biology and evolution},
0d680d17278c Uploaded greg parents: 29 diff changeset	255 author = {7. Katoh K, Standley DM},
0d680d17278c Uploaded greg parents: 29 diff changeset	256 title = {MAFFT multiple sequence alignment software version 7: improvements in performance and usability},
0d680d17278c Uploaded greg parents: 29 diff changeset	257 year = {2013},
0d680d17278c Uploaded greg parents: 29 diff changeset	258 volume = {30},
0d680d17278c Uploaded greg parents: 29 diff changeset	259 number = {4},
0d680d17278c Uploaded greg parents: 29 diff changeset	260 pages = {772-780},}
0d680d17278c Uploaded greg parents: 29 diff changeset	261 </citation>
0d680d17278c Uploaded greg parents: 29 diff changeset	262 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	263 @article{Sasidharan2012,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	264 journal = {Nucleic Acids Research},
30 0d680d17278c Uploaded greg parents: 29 diff changeset	265 author = {8. Sasidharan R, Nepusz T, Swarbreck D, Huala E, Paccanaro A},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	266 title = {GFam: a platform for automatic annotation of gene families},
eda72de47171 Uploaded greg parents: 27 diff changeset	267 year = {2012},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	268 pages = {gks631},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	269 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	270 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	271 @article{Li2003,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	272 journal = {Genome Research}
30 0d680d17278c Uploaded greg parents: 29 diff changeset	273 author = {9. Li L, Stoeckert CJ, Roos DS},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	274 title = {OrthoMCL: identification of ortholog groups for eukaryotic genomes},
eda72de47171 Uploaded greg parents: 27 diff changeset	275 year = {2003},
eda72de47171 Uploaded greg parents: 27 diff changeset	276 volume = {13},
eda72de47171 Uploaded greg parents: 27 diff changeset	277 number = {9},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	278 pages = {2178-2189},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	279 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	280 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	281 @article{Emms2015,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	282 journal = {Genome Biology}
30 0d680d17278c Uploaded greg parents: 29 diff changeset	283 author = {10. Emms DM, Kelly S},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	284 title = {OrthoFinder: solving fundamental biases in whole genome comparisons dramatically improves orthogroup inference accuracy},
eda72de47171 Uploaded greg parents: 27 diff changeset	285 year = {2015},
eda72de47171 Uploaded greg parents: 27 diff changeset	286 volume = {16},
eda72de47171 Uploaded greg parents: 27 diff changeset	287 number = {1},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	288 pages = {157},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	289 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	290 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	291 @article{Capella-Gutierrez2009,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	292 journal = {Bioinformatics,},
30 0d680d17278c Uploaded greg parents: 29 diff changeset	293 author = {11. Capella-Gutierrez S, Silla-Martínez JM, Gabaldón T},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	294 title = {trimAl: a tool for automated alignment trimming in large-scale phylogenetic analyses},
eda72de47171 Uploaded greg parents: 27 diff changeset	295 year = {2009},
eda72de47171 Uploaded greg parents: 27 diff changeset	296 volume = {25},
eda72de47171 Uploaded greg parents: 27 diff changeset	297 number = {15},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	298 pages = {1972-1973},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	299 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	300 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	301 @article{Gremme2013,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	302 journal = {IEEE/ACM Transactions on Computational Biology and Bioinformatics},
30 0d680d17278c Uploaded greg parents: 29 diff changeset	303 author = {12. Gremme G, Steinbiss S, Kurtz S},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	304 title = {GenomeTools: a comprehensive software library for efficient processing of structured genome annotations},
eda72de47171 Uploaded greg parents: 27 diff changeset	305 year = {2013},
eda72de47171 Uploaded greg parents: 27 diff changeset	306 volume = {10},
eda72de47171 Uploaded greg parents: 27 diff changeset	307 number = {3},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	308 pages = {645-656},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	309 </citation>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	310 </citations>
cecea7fdccf8 Uploaded greg parents: diff changeset	311 </tool>

Mercurial > repos > greg > assembly_post_processor

annotate assembly_post_processor.xml @ 92:55024e4d84d4 draft