assembly_post_processor: assembly_post

annotate assembly_post_processor.xml @ 87:e8d7d4a1672f draft

Uploaded

author	greg
date	Wed, 25 Oct 2017 09:13:54 -0400
parents	126430ebebf7
children	a9ca872be416

rev	line source
74 9da5dc4b99cc Uploaded greg parents: 73 diff changeset	1 <tool id="plant_tribes_assembly_post_processor" name="AssemblyPostProcessor" version="@WRAPPER_VERSION@.3.0">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	2 <description>post-processes de novo transcriptome assembly</description>
37 cc4dba9f6ecd Uploaded greg parents: 36 diff changeset	3 <macros>
cc4dba9f6ecd Uploaded greg parents: 36 diff changeset	4 <import>macros.xml</import>
cc4dba9f6ecd Uploaded greg parents: 36 diff changeset	5 </macros>
74 9da5dc4b99cc Uploaded greg parents: 73 diff changeset	6 <requirements>
9da5dc4b99cc Uploaded greg parents: 73 diff changeset	7 <requirement type="package" version="1.0.3">plant_tribes_assembly_post_processor</requirement>
9da5dc4b99cc Uploaded greg parents: 73 diff changeset	8 </requirements>
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	9 <command detect_errors="exit_code"><![CDATA[
86 126430ebebf7 Uploaded greg parents: 85 diff changeset	10 #set output_dir = 'assemblyPostProcessing_dir'
126430ebebf7 Uploaded greg parents: 85 diff changeset	11 AssemblyPostProcessor
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	12 --transcripts '$input'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	13 --prediction_method $prediction_method_cond.prediction_method
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	14 #if str($prediction_method_cond.prediction_method) == 'estscan':
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	15 --score_matrices '$score_matrices'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	16 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	17 #if str($options_type.options_type_selector) == 'advanced':
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	18 #set target_gene_family_assembly_cond = $options_type.target_gene_family_assembly_cond
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	19 #if str($target_gene_family_assembly_cond.target_gene_family_assembly) == 'yes':
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	20 --gene_family_search '$target_gene_family_assembly_cond.orthogroups'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	21 --scaffold '$target_gene_family_assembly_cond.scaffold.fields.path'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	22 --method '$target_gene_family_assembly_cond.method'
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	23 --gap_trimming $target_gene_family_assembly_cond.gap_trimming
85 b5aac0d2c99c Uploaded greg parents: 84 diff changeset	24 --min_coverage $target_gene_family_assembly_cond.min_coverage
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	25 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	26 #if str($options_type.strand_specific) == 'yes':
72 b3d4fd21506d Uploaded greg parents: 71 diff changeset	27 --strand_specific true
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	28 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	29 #if str($options_type.dereplicate) == 'yes':
72 b3d4fd21506d Uploaded greg parents: 71 diff changeset	30 --dereplicate true
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	31 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	32 --min_length $options_type.min_length
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	33 #end if
cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	34 --num_threads \${GALAXY_SLOTS:-4}
87 e8d7d4a1672f Uploaded greg parents: 86 diff changeset	35 2>&1
86 126430ebebf7 Uploaded greg parents: 85 diff changeset	36 && mv $output_dir/transcripts.cds '$output_cds'
126430ebebf7 Uploaded greg parents: 85 diff changeset	37 && mv $output_dir/transcripts.pep '$output_pep'
126430ebebf7 Uploaded greg parents: 85 diff changeset	38 && mv $output_dir/transcripts.cleaned.cds '$output_cleaned_cds'
126430ebebf7 Uploaded greg parents: 85 diff changeset	39 && mv $output_dir/transcripts.cleaned.pep '$output_cleaned_pep'
126430ebebf7 Uploaded greg parents: 85 diff changeset	40 #if str($options_type.options_type_selector) == 'advanced':
126430ebebf7 Uploaded greg parents: 85 diff changeset	41 #if str($target_gene_family_assembly_cond.target_gene_family_assembly) == 'yes':
126430ebebf7 Uploaded greg parents: 85 diff changeset	42 && mv $output_dir/targeted_gene_family_assemblies.stats '$output_targeted_gene_families_stats'
126430ebebf7 Uploaded greg parents: 85 diff changeset	43 #end if
126430ebebf7 Uploaded greg parents: 85 diff changeset	44 #if str($options_type.dereplicate) == 'yes':
126430ebebf7 Uploaded greg parents: 85 diff changeset	45 && mv $output_dir/transcripts.cleaned.nr.cds '$output_cleaned_nr_cds'
126430ebebf7 Uploaded greg parents: 85 diff changeset	46 && mv $output_dir/transcripts.cleaned.nr.pep '$output_cleaned_nr_pep'
126430ebebf7 Uploaded greg parents: 85 diff changeset	47 #end if
126430ebebf7 Uploaded greg parents: 85 diff changeset	48 #end if
70 cf4bf94e87d2 Uploaded greg parents: 69 diff changeset	49 ]]></command>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	50 <inputs>
28 eda72de47171 Uploaded greg parents: 27 diff changeset	51 <param name="input" format="fasta" type="data" label="Transcriptome assembly fasta file"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	52 <conditional name="prediction_method_cond">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	53 <param name="prediction_method" type="select" label="Coding regions prediction method">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	54 <option value="transdecoder" selected="true">TransDecoder</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	55 <option value="estscan">ESTScan</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	56 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	57 <when value="transdecoder" />
cecea7fdccf8 Uploaded greg parents: diff changeset	58 <when value="estscan">
cecea7fdccf8 Uploaded greg parents: diff changeset	59 <param name="score_matrices" format="smat" type="data" label="Scores matrices"/>
cecea7fdccf8 Uploaded greg parents: diff changeset	60 </when>
cecea7fdccf8 Uploaded greg parents: diff changeset	61 </conditional>
cecea7fdccf8 Uploaded greg parents: diff changeset	62 <conditional name="options_type">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	63 <param name="options_type_selector" type="select" label="Options configuration">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	64 <option value="basic" selected="true">Basic</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	65 <option value="advanced">Advanced</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	66 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	67 <when value="basic" />
cecea7fdccf8 Uploaded greg parents: diff changeset	68 <when value="advanced">
cecea7fdccf8 Uploaded greg parents: diff changeset	69 <conditional name="target_gene_family_assembly_cond">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	70 <param name="target_gene_family_assembly" type="select" label="Perform targeted gene assembly?">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	71 <option value="no" selected="true">No</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	72 <option value="yes">Yes</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	73 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	74 <when value="no" />
cecea7fdccf8 Uploaded greg parents: diff changeset	75 <when value="yes">
28 eda72de47171 Uploaded greg parents: 27 diff changeset	76 <param name="orthogroups" format="tabular" type="data" label="Targeted gene families"/>
33 0a292e319d0c Uploaded greg parents: 32 diff changeset	77 <param name="scaffold" type="select" label="Gene family scaffold">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	78 <options from_data_table="plant_tribes_scaffolds" />
10 db0c2baf176f Uploaded greg parents: 9 diff changeset	79 <validator type="no_options" message="No PlantTribes scaffolds are available. Use the PlantTribes Scaffolds Download Data Manager tool in Galaxy to install and populate the PlantTribes scaffolds data table."/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	80 </param>
cecea7fdccf8 Uploaded greg parents: diff changeset	81 <param name="method" type="select" label="Protein clustering method">
cecea7fdccf8 Uploaded greg parents: diff changeset	82 <option value="gfam" selected="true">GFam</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	83 <option value="orthofinder">OrthoFinder</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	84 <option value="orthomcl">OrthoMCL</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	85 </param>
39 b0ea1e985a38 Uploaded greg parents: 38 diff changeset	86 <param name="gap_trimming" type="float" value="0.1" min="0" max="1.0" label="Trim alignments"/>
85 b5aac0d2c99c Uploaded greg parents: 84 diff changeset	87 <param name="min_coverage" type="float" value="0.5" min="0.3" max="1.0" label="Minimum alignment coverage"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	88 </when>
cecea7fdccf8 Uploaded greg parents: diff changeset	89 </conditional>
28 eda72de47171 Uploaded greg parents: 27 diff changeset	90 <param name="strand_specific" type="select" label="Strand-specific assembly?">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	91 <option value="no" selected="true">No</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	92 <option value="yes">Yes</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	93 </param>
28 eda72de47171 Uploaded greg parents: 27 diff changeset	94 <param name="dereplicate" type="select" label="Remove duplicate sequences?">
0 cecea7fdccf8 Uploaded greg parents: diff changeset	95 <option value="no" selected="true">No</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	96 <option value="yes">Yes</option>
cecea7fdccf8 Uploaded greg parents: diff changeset	97 </param>
28 eda72de47171 Uploaded greg parents: 27 diff changeset	98 <param name="min_length" type="integer" value="200" label="Minimum sequence length"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	99 </when>
cecea7fdccf8 Uploaded greg parents: diff changeset	100 </conditional>
cecea7fdccf8 Uploaded greg parents: diff changeset	101 </inputs>
cecea7fdccf8 Uploaded greg parents: diff changeset	102 <outputs>
84 b1102f939fdd Uploaded greg parents: 82 diff changeset	103 <data name="output_targeted_gene_families_stats" format="tabular" label="Targeted gene families statistics: ${tool.name} on ${on_string}">
b1102f939fdd Uploaded greg parents: 82 diff changeset	104 <filter>options_type['options_type_selector'] == 'advanced' and options_type['target_gene_family_assembly_cond']['target_gene_family_assembly'] == 'yes'</filter>
b1102f939fdd Uploaded greg parents: 82 diff changeset	105 </data>
80 32382b0d5add Uploaded greg parents: 78 diff changeset	106 <collection name="output_targeted_gene_families" type="list" label="Targeted gene families: ${tool.name} on ${on_string}">
82 8378d126347a Uploaded greg parents: 80 diff changeset	107 <discover_datasets pattern="__name__" directory="assemblyPostProcessing_dir/targeted_gene_family_assemblies" format="fasta" />
62 9eabe9e58fb5 Uploaded greg parents: 61 diff changeset	108 <filter>options_type['options_type_selector'] == 'advanced' and options_type['target_gene_family_assembly_cond']['target_gene_family_assembly'] == 'yes'</filter>
80 32382b0d5add Uploaded greg parents: 78 diff changeset	109 </collection>
68 338dfc33b7a7 Uploaded greg parents: 67 diff changeset	110 <data name="output_pep" format="fasta" label="transcripts.pep: ${tool.name} on ${on_string}"/>
338dfc33b7a7 Uploaded greg parents: 67 diff changeset	111 <data name="output_cleaned_pep" format="fasta" label="transcripts.cleaned.pep: ${tool.name} on ${on_string}"/>
338dfc33b7a7 Uploaded greg parents: 67 diff changeset	112 <data name="output_cleaned_nr_pep" format="fasta" label="transcripts.cleaned.nr.pep: ${tool.name} on ${on_string}">
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	113 <filter>options_type['options_type_selector'] == 'advanced' and options_type['dereplicate'] == 'yes'</filter>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	114 </data>
68 338dfc33b7a7 Uploaded greg parents: 67 diff changeset	115 <data name="output_cleaned_nr_cds" format="fasta" label="transcripts.cleaned.nr.cds: ${tool.name} on ${on_string}">
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	116 <filter>options_type['options_type_selector'] == 'advanced' and options_type['dereplicate'] == 'yes'</filter>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	117 </data>
68 338dfc33b7a7 Uploaded greg parents: 67 diff changeset	118 <data name="output_cleaned_cds" format="fasta" label="transcripts.cleaned.cds: ${tool.name} on ${on_string}"/>
338dfc33b7a7 Uploaded greg parents: 67 diff changeset	119 <data name="output_cds" format="fasta" label="transcripts.cds: ${tool.name} on ${on_string}"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	120 </outputs>
cecea7fdccf8 Uploaded greg parents: diff changeset	121 <tests>
cecea7fdccf8 Uploaded greg parents: diff changeset	122 <test>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	123 <param name="input" value="assembly.fasta" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	124 <param name="prediction_method" value="transdecoder"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	125 <output name="output_cds" file="transcripts.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	126 <output name="output_cleaned_cds" file="transcripts.cleaned.cds" ftype="fasta"/>
69 61f9552be416 Uploaded greg parents: 68 diff changeset	127 <output name="output_cleaned_pep" file="transcripts.cleaned.pep" ftype="fasta"/>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	128 <output name="output_pep" file="transcripts.pep" ftype="fasta"/>
6 bf355f832557 Uploaded greg parents: 5 diff changeset	129 </test>
bf355f832557 Uploaded greg parents: 5 diff changeset	130 <test>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	131 <param name="input" value="assembly.fasta" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	132 <param name="prediction_method" value="estscan"/>
55 5c221f721b95 Uploaded greg parents: 48 diff changeset	133 <param name="score_matrices" value="arabidopsis_thaliana.smat" ftype="smat"/>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	134 <param name="options_type_selector" value="advanced"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	135 <param name="dereplicate" value="yes"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	136 <output name="output_cds" file="transcripts2.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	137 <output name="output_cleaned_cds" file="transcripts.cleaned.nr.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	138 <output name="output_cleaned_nr_cds" file="transcripts.cleaned.nr.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	139 <output name="output_cleaned_nr_pep" file="transcripts.cleaned.nr.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	140 <output name="output_cleaned_pep" file="transcripts.cleaned.nr.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	141 <output name="output_pep" file="transcripts2.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	142 </test>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	143 <test>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	144 <param name="input" value="assembly_tgf.fasta" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	145 <param name="prediction_method" value="transdecoder"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	146 <param name="options_type_selector" value="advanced"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	147 <param name="target_gene_family_assembly" value="yes"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	148 <param name="orthogroups" value="target_orthos.ids"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	149 <param name="scaffold" value="22Gv1.1"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	150 <param name="method" value="orthomcl"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	151 <param name="dereplicate" value="yes"/>
87 e8d7d4a1672f Uploaded greg parents: 86 diff changeset	152 <param name="min_coverage" value="0.3"/>
82 8378d126347a Uploaded greg parents: 80 diff changeset	153 <output_collection name="output_targeted_gene_families" type="list">
8378d126347a Uploaded greg parents: 80 diff changeset	154 <element name="752.faa" file="752.faa" ftype="fasta"/>
8378d126347a Uploaded greg parents: 80 diff changeset	155 <element name="752.fasta" file="752.fasta" ftype="fasta"/>
8378d126347a Uploaded greg parents: 80 diff changeset	156 <element name="752.fna" file="752.fna" ftype="fasta"/>
8378d126347a Uploaded greg parents: 80 diff changeset	157 </output_collection>
85 b5aac0d2c99c Uploaded greg parents: 84 diff changeset	158 <output name="output_targeted_gene_families_stats" file="output_targeted_gene_families_stats.tabular" ftype="tabular"/>
66 09ae3a0d7273 Uploaded greg parents: 62 diff changeset	159 <output name="output_cds" file="transcripts_tgf.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	160 <output name="output_cleaned_cds" file="transcripts.cleaned_tgf.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	161 <output name="output_cleaned_nr_cds" file="transcripts_tgf.cleaned.nr.cds" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	162 <output name="output_cleaned_nr_pep" file="transcripts_tgf.cleaned.nr.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	163 <output name="output_cleaned_pep" file="transcripts.cleaned_tgf.pep" ftype="fasta"/>
09ae3a0d7273 Uploaded greg parents: 62 diff changeset	164 <output name="output_pep" file="transcripts_tgf.pep" ftype="fasta"/>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	165 </test>
cecea7fdccf8 Uploaded greg parents: diff changeset	166 </tests>
cecea7fdccf8 Uploaded greg parents: diff changeset	167 <help>
33 0a292e319d0c Uploaded greg parents: 32 diff changeset	168 This tool is one of the PlantTribes collection of automated modular analysis pipelines for comparative and
28 eda72de47171 Uploaded greg parents: 27 diff changeset	169 evolutionary analyses of genome-scale gene families and transcriptomes. This tool post-processes de novo
eda72de47171 Uploaded greg parents: 27 diff changeset	170 assembled transcripts into putative coding sequences and their corresponding amino acid translations and
eda72de47171 Uploaded greg parents: 27 diff changeset	171 optionally assigns transcripts to circumscribed gene families ("orthogroups")[2]. After transcripts have been
eda72de47171 Uploaded greg parents: 27 diff changeset	172 assigned to gene families, overlapping contigs can be identified and merged to reduce fragmentation in the
eda72de47171 Uploaded greg parents: 27 diff changeset	173 de novo assembly.
0 cecea7fdccf8 Uploaded greg parents: diff changeset	174
cecea7fdccf8 Uploaded greg parents: diff changeset	175 -----
cecea7fdccf8 Uploaded greg parents: diff changeset	176
28 eda72de47171 Uploaded greg parents: 27 diff changeset	177 Required options
eda72de47171 Uploaded greg parents: 27 diff changeset	178
eda72de47171 Uploaded greg parents: 27 diff changeset	179 * Transcriptome assembly fasta file - either de novo or reference-guided transcriptome assembly fasta file selected from your history.
33 0a292e319d0c Uploaded greg parents: 32 diff changeset	180 * Coding regions prediction method - method for finding coding regions within transcripts. Available methods are TransDecoder[3] and ESTScan[4].
0a292e319d0c Uploaded greg parents: 32 diff changeset	181 * Scores matrices - scores matrices, based on a related species, are required when ESTScan is used to find coding regions. Details of how to create species-specific scores matrices can be found on the ESTScan website (http://estscan.sourceforge.net). Matrices of some organisms are also available to download.
28 eda72de47171 Uploaded greg parents: 27 diff changeset	182
eda72de47171 Uploaded greg parents: 27 diff changeset	183 Other options
0 cecea7fdccf8 Uploaded greg parents: diff changeset	184
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	185 * Perform targeted gene assembly? - selecting 'Yes' enables local assembly of one or more targeted gene families in a specific scaffold. Scaffolds are defined in PlantTribes as clusters of paralogous/orthologous sequences from a specified set of proteomes[5-7].
35 2d4590d05b29 Uploaded greg parents: 34 diff changeset	186
84 b1102f939fdd Uploaded greg parents: 82 diff changeset	187 * Targeted gene families - select a history item containing a list of targeted orthogroup identifiers corresponding to the gene family classification from a specified scaffold. Gene family identifiers can be obtained from the function annotation table ("Orthogroup ID" field of .summary file) of scaffold data installed into Galaxy via the PlantTribes Scaffolds Download Data Manager tool, and are also available in the PlantTribes "annotation" directory of the scaffold data download.
35 2d4590d05b29 Uploaded greg parents: 34 diff changeset	188 * Gene family scaffold - one of the PlantTribes gene family scaffolds (installed into Galaxy by the PlantTribes Scaffolds Download Data Manager tool) whose orthogroup(s) are targeted for the localized assembly.
2d4590d05b29 Uploaded greg parents: 34 diff changeset	189 * Protein clustering method - gene family scaffold protein clustering method. Each PlantTribes scaffold data has up to three sets of clusters - GFam[8] (clusters of consensus domain architecture), OrthoFinder[9] (broadly defined clusters) or OrthoMCL[10] (narrowly defined clusters). You can also install your own data scaffold created using a different clustering method as long as it conforms to the PlantTribes scaffold data format.
39 b0ea1e985a38 Uploaded greg parents: 38 diff changeset	190 * Trim alignments - trim gene family multiple sequence alignments that include scaffold backbone genes and locally assembled transcripts to remove non-conserved regions (gappy sites)[11]. The trimmed alignments are used in assigning scores to locally assembled transcripts to determine how well they compare to the backbone gene models. The default setting of 0.1 removes sites that have gaps in 90% or more of the sequences in the multiple sequence alignment. This option is restricted to the range 0.0 - 1.0.
85 b5aac0d2c99c Uploaded greg parents: 84 diff changeset	191 * Minimum alignment coverage - allowable sequence coverage in the orthogroup trimmed protein multiple sequence alignments. The default setting of 0.5 reports assembled targeted gene family transcripts with at least 50% coverage of the conserved regions in the trimmed multiple sequence alignment.
35 2d4590d05b29 Uploaded greg parents: 34 diff changeset	192
28 eda72de47171 Uploaded greg parents: 27 diff changeset	193 * Strand-specific assembly? - select 'Yes' if transcriptome library sequences were strand-specific. If 'Yes" is selected, transcripts from the minority strand (antisense) are removed.
eda72de47171 Uploaded greg parents: 27 diff changeset	194 * Remove duplicate sequences? - select 'Yes' to remove duplicated and exact subsequences[12].
eda72de47171 Uploaded greg parents: 27 diff changeset	195 * Minimum sequence length - set the minimum sequence length of predicted coding regions. The default is 200 bp.
31 0fad708a9693 Uploaded greg parents: 30 diff changeset	196
0 cecea7fdccf8 Uploaded greg parents: diff changeset	197 </help>
cecea7fdccf8 Uploaded greg parents: diff changeset	198 <citations>
37 cc4dba9f6ecd Uploaded greg parents: 36 diff changeset	199 <expand macro="citation1" />
28 eda72de47171 Uploaded greg parents: 27 diff changeset	200 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	201 @article{Honaas2016,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	202 journal = {PloS one},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	203 author = {2. Honaas LA, Wafula EK, Wickett NJ, Der JP, Zhang Y, Edger PP, Altman NS, Pires JC, Leebens-Mack JH},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	204 title = {Selecting superior de novo transcriptome assemblies: lessons learned by leveraging the best plant genome},
eda72de47171 Uploaded greg parents: 27 diff changeset	205 year = {2016},
eda72de47171 Uploaded greg parents: 27 diff changeset	206 volume = {11},
eda72de47171 Uploaded greg parents: 27 diff changeset	207 number = {1},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	208 pages = {e0146062},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	209 </citation>
24 a39def7197cf Uploaded greg parents: 23 diff changeset	210 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	211 @article{Haas2013,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	212 journal = {Nature Protocols},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	213 author = {3. Haas BJ, Papanicolaou A, Yassour M, Grabherr M, Blood PD, Bowden J, Couger MB, Eccles D, Li B, Lieber M, MacManes MD},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	214 title = {De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis},
eda72de47171 Uploaded greg parents: 27 diff changeset	215 year = {2013},
eda72de47171 Uploaded greg parents: 27 diff changeset	216 volume = {8},
eda72de47171 Uploaded greg parents: 27 diff changeset	217 number = {8},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	218 pages = {1494-1512},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	219 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	220 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	221 @article{Iseli1999,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	222 journal = {ISMB},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	223 author = {4. Iseli C, Jongeneel CV, Bucher P},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	224 title = {ESTScan: a program for detecting, evaluating, and reconstructing potential coding regions in EST sequences},
24 a39def7197cf Uploaded greg parents: 23 diff changeset	225 year = {1999},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	226 volume = {99},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	227 pages = {138-148},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	228 url = {http://estscan.sourceforge.net},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	229 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	230 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	231 @article{Huang1999,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	232 journal = {Genome Research},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	233 author = {5. Huang X, Madan A},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	234 title = {CAP3: A DNA sequence assembly program},
eda72de47171 Uploaded greg parents: 27 diff changeset	235 year = {1999},
eda72de47171 Uploaded greg parents: 27 diff changeset	236 volume = {9},
eda72de47171 Uploaded greg parents: 27 diff changeset	237 number = {9},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	238 pages = {868-877},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	239 url = {http://seq.cs.iastate.edu/cap3.html},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	240 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	241 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	242 @article{Eddy2009,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	243 journal = {Genome Inform},
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	244 author = {6. Eddy SR},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	245 title = {A new generation of homology search tools based on probabilistic inference},
eda72de47171 Uploaded greg parents: 27 diff changeset	246 year = {2009},
eda72de47171 Uploaded greg parents: 27 diff changeset	247 volume = {23},
eda72de47171 Uploaded greg parents: 27 diff changeset	248 number = {1},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	249 pages = {205-211},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	250 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	251 <citation type="bibtex">
30 0d680d17278c Uploaded greg parents: 29 diff changeset	252 @article{Katoh2013,
0d680d17278c Uploaded greg parents: 29 diff changeset	253 journal = {Molecular biology and evolution},
0d680d17278c Uploaded greg parents: 29 diff changeset	254 author = {7. Katoh K, Standley DM},
0d680d17278c Uploaded greg parents: 29 diff changeset	255 title = {MAFFT multiple sequence alignment software version 7: improvements in performance and usability},
0d680d17278c Uploaded greg parents: 29 diff changeset	256 year = {2013},
0d680d17278c Uploaded greg parents: 29 diff changeset	257 volume = {30},
0d680d17278c Uploaded greg parents: 29 diff changeset	258 number = {4},
0d680d17278c Uploaded greg parents: 29 diff changeset	259 pages = {772-780},}
0d680d17278c Uploaded greg parents: 29 diff changeset	260 </citation>
0d680d17278c Uploaded greg parents: 29 diff changeset	261 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	262 @article{Sasidharan2012,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	263 journal = {Nucleic Acids Research},
30 0d680d17278c Uploaded greg parents: 29 diff changeset	264 author = {8. Sasidharan R, Nepusz T, Swarbreck D, Huala E, Paccanaro A},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	265 title = {GFam: a platform for automatic annotation of gene families},
eda72de47171 Uploaded greg parents: 27 diff changeset	266 year = {2012},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	267 pages = {gks631},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	268 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	269 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	270 @article{Li2003,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	271 journal = {Genome Research}
30 0d680d17278c Uploaded greg parents: 29 diff changeset	272 author = {9. Li L, Stoeckert CJ, Roos DS},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	273 title = {OrthoMCL: identification of ortholog groups for eukaryotic genomes},
eda72de47171 Uploaded greg parents: 27 diff changeset	274 year = {2003},
eda72de47171 Uploaded greg parents: 27 diff changeset	275 volume = {13},
eda72de47171 Uploaded greg parents: 27 diff changeset	276 number = {9},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	277 pages = {2178-2189},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	278 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	279 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	280 @article{Emms2015,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	281 journal = {Genome Biology}
30 0d680d17278c Uploaded greg parents: 29 diff changeset	282 author = {10. Emms DM, Kelly S},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	283 title = {OrthoFinder: solving fundamental biases in whole genome comparisons dramatically improves orthogroup inference accuracy},
eda72de47171 Uploaded greg parents: 27 diff changeset	284 year = {2015},
eda72de47171 Uploaded greg parents: 27 diff changeset	285 volume = {16},
eda72de47171 Uploaded greg parents: 27 diff changeset	286 number = {1},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	287 pages = {157},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	288 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	289 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	290 @article{Capella-Gutierrez2009,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	291 journal = {Bioinformatics,},
30 0d680d17278c Uploaded greg parents: 29 diff changeset	292 author = {11. Capella-Gutierrez S, Silla-Martínez JM, Gabaldón T},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	293 title = {trimAl: a tool for automated alignment trimming in large-scale phylogenetic analyses},
eda72de47171 Uploaded greg parents: 27 diff changeset	294 year = {2009},
eda72de47171 Uploaded greg parents: 27 diff changeset	295 volume = {25},
eda72de47171 Uploaded greg parents: 27 diff changeset	296 number = {15},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	297 pages = {1972-1973},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	298 </citation>
eda72de47171 Uploaded greg parents: 27 diff changeset	299 <citation type="bibtex">
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	300 @article{Gremme2013,
443c8e1fd8aa Uploaded greg parents: 28 diff changeset	301 journal = {IEEE/ACM Transactions on Computational Biology and Bioinformatics},
30 0d680d17278c Uploaded greg parents: 29 diff changeset	302 author = {12. Gremme G, Steinbiss S, Kurtz S},
28 eda72de47171 Uploaded greg parents: 27 diff changeset	303 title = {GenomeTools: a comprehensive software library for efficient processing of structured genome annotations},
eda72de47171 Uploaded greg parents: 27 diff changeset	304 year = {2013},
eda72de47171 Uploaded greg parents: 27 diff changeset	305 volume = {10},
eda72de47171 Uploaded greg parents: 27 diff changeset	306 number = {3},
29 443c8e1fd8aa Uploaded greg parents: 28 diff changeset	307 pages = {645-656},}
28 eda72de47171 Uploaded greg parents: 27 diff changeset	308 </citation>
0 cecea7fdccf8 Uploaded greg parents: diff changeset	309 </citations>
cecea7fdccf8 Uploaded greg parents: diff changeset	310 </tool>

Mercurial > repos > greg > assembly_post_processor

annotate assembly_post_processor.xml @ 87:e8d7d4a1672f draft