edger_with_design_matrix: edgeR_Concatenate_Expression

annotate edgeR_Concatenate_Expression_Matrices.xml @ 27:c6463da87893 draft

Uploaded

author	yhoogstrate
date	Tue, 20 May 2014 05:27:02 -0400
parents
children	c86f1f86b3c1

rev	line source
27 c6463da87893 Uploaded yhoogstrate parents: diff changeset	1 <?xml version="1.0" encoding="UTF-8"?>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	2 <tool id="concatenate_expression_matrices" name="edgeR: Concatenate Expression Matrices">
c6463da87893 Uploaded yhoogstrate parents: diff changeset	3 <description>Create a full expression matrix by selecting the desired columns from specific count tables</description>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	4
c6463da87893 Uploaded yhoogstrate parents: diff changeset	5 <command>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	6 #set $j = 0
c6463da87893 Uploaded yhoogstrate parents: diff changeset	7 #set $paste = []
c6463da87893 Uploaded yhoogstrate parents: diff changeset	8
c6463da87893 Uploaded yhoogstrate parents: diff changeset	9 #if $add_geneids.choice == "true":
c6463da87893 Uploaded yhoogstrate parents: diff changeset	10 #set $filename = str($j)+".txt"
c6463da87893 Uploaded yhoogstrate parents: diff changeset	11 #set paste = paste + [$filename]
c6463da87893 Uploaded yhoogstrate parents: diff changeset	12
c6463da87893 Uploaded yhoogstrate parents: diff changeset	13 cut -f $add_geneids.column_geneids.value "$add_geneids.sample_geneids" > $filename ;
c6463da87893 Uploaded yhoogstrate parents: diff changeset	14 #set $j += 1
c6463da87893 Uploaded yhoogstrate parents: diff changeset	15 #end if
c6463da87893 Uploaded yhoogstrate parents: diff changeset	16
c6463da87893 Uploaded yhoogstrate parents: diff changeset	17 #for $sample in $samples:
c6463da87893 Uploaded yhoogstrate parents: diff changeset	18 ##echo "$sample.column_index"
c6463da87893 Uploaded yhoogstrate parents: diff changeset	19 ##echo "$sample.column_index.value"
c6463da87893 Uploaded yhoogstrate parents: diff changeset	20
c6463da87893 Uploaded yhoogstrate parents: diff changeset	21 #set $column_str = ",".join([str(x).strip() for x in $sample.column_index.value])
c6463da87893 Uploaded yhoogstrate parents: diff changeset	22 #set $filename = str($j)+".txt"
c6463da87893 Uploaded yhoogstrate parents: diff changeset	23 #set paste = paste + [$filename]
c6463da87893 Uploaded yhoogstrate parents: diff changeset	24
c6463da87893 Uploaded yhoogstrate parents: diff changeset	25 cut -f "$column_str" "$sample.sample" > $filename ;
c6463da87893 Uploaded yhoogstrate parents: diff changeset	26 #set $j += 1
c6463da87893 Uploaded yhoogstrate parents: diff changeset	27 #end for
c6463da87893 Uploaded yhoogstrate parents: diff changeset	28
c6463da87893 Uploaded yhoogstrate parents: diff changeset	29 #if $add_lengths.choice == "true":
c6463da87893 Uploaded yhoogstrate parents: diff changeset	30 #set $filename = str($j)+".txt"
c6463da87893 Uploaded yhoogstrate parents: diff changeset	31 #set paste = paste + [$filename]
c6463da87893 Uploaded yhoogstrate parents: diff changeset	32
c6463da87893 Uploaded yhoogstrate parents: diff changeset	33 cut -f $add_lengths.column_lengths.value "$add_lengths.sample_lengths" > $filename ;
c6463da87893 Uploaded yhoogstrate parents: diff changeset	34 #set $j += 1
c6463da87893 Uploaded yhoogstrate parents: diff changeset	35 #end if
c6463da87893 Uploaded yhoogstrate parents: diff changeset	36
c6463da87893 Uploaded yhoogstrate parents: diff changeset	37 #set $paste_str = " ".join([str(x).strip() for x in $paste])
c6463da87893 Uploaded yhoogstrate parents: diff changeset	38
c6463da87893 Uploaded yhoogstrate parents: diff changeset	39 paste $paste_str > $expression_matrix
c6463da87893 Uploaded yhoogstrate parents: diff changeset	40 </command>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	41
c6463da87893 Uploaded yhoogstrate parents: diff changeset	42 <inputs>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	43 <conditional name="add_geneids">
c6463da87893 Uploaded yhoogstrate parents: diff changeset	44 <param name="choice" type="select" label="Add a gene-IDs column at the end of the file" help="Highly recommended to select!" >
c6463da87893 Uploaded yhoogstrate parents: diff changeset	45 <option value="false">No</option>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	46 <option value="true" selected="true">Yes</option>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	47 </param>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	48 <when value="false" />
c6463da87893 Uploaded yhoogstrate parents: diff changeset	49 <when value="true">
c6463da87893 Uploaded yhoogstrate parents: diff changeset	50 <param name="sample_geneids" type="data" format="tabular" label="Select Read-count dataset that contains a column for GeneIDs" help="from featureCounts/DEXSeq-count/HTSeq-count, etc." />
c6463da87893 Uploaded yhoogstrate parents: diff changeset	51 <param name="column_geneids" numerical="false" use_header_names="true" label="Select GeneID column" type="data_column" data_ref="sample_geneids" multiple="false">
c6463da87893 Uploaded yhoogstrate parents: diff changeset	52 <validator type="no_options" message="Please select at least one column." />
c6463da87893 Uploaded yhoogstrate parents: diff changeset	53 </param>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	54 </when>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	55 </conditional>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	56
c6463da87893 Uploaded yhoogstrate parents: diff changeset	57 <repeat name="samples" title="Expression Table" help="E.g. a earlier concatenated table, or a HT-seq, featureCounts or DESeq-count result.">
c6463da87893 Uploaded yhoogstrate parents: diff changeset	58 <param name="sample" type="data" format="tabular" label="Read-count dataset that belongs to a pair" help="from featureCounts/DEXSeq-count/HTSeq-count, etc." />
c6463da87893 Uploaded yhoogstrate parents: diff changeset	59 <!-- select columns -->
c6463da87893 Uploaded yhoogstrate parents: diff changeset	60 <param name="column_index" numerical="false" use_header_names="true" label="Select columns that are associated with this factor level" type="data_column" data_ref="sample" multiple="true" size="120" display="checkboxes">
c6463da87893 Uploaded yhoogstrate parents: diff changeset	61 <validator type="no_options" message="Please select at least one column." />
c6463da87893 Uploaded yhoogstrate parents: diff changeset	62 </param>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	63 </repeat>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	64
c6463da87893 Uploaded yhoogstrate parents: diff changeset	65 <conditional name="add_lengths">
c6463da87893 Uploaded yhoogstrate parents: diff changeset	66 <param name="choice" type="select" label="Add a gene-lengths column at the end of the file" help="Optional, only usefull if RPKM/FPKM calculation is desired." >
c6463da87893 Uploaded yhoogstrate parents: diff changeset	67 <option value="false">No</option>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	68 <option value="true">Yes</option>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	69 </param>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	70 <when value="false" />
c6463da87893 Uploaded yhoogstrate parents: diff changeset	71 <when value="true">
c6463da87893 Uploaded yhoogstrate parents: diff changeset	72 <param name="sample_lengths" type="data" format="tabular" label="Read-count dataset that belongs to a pair" help="from featureCounts/DEXSeq-count/HTSeq-count, etc." />
c6463da87893 Uploaded yhoogstrate parents: diff changeset	73 <param name="column_lengths" numerical="false" use_header_names="true" label="Select columns that are associated with this factor level" type="data_column" data_ref="sample_lengths" multiple="false" size="120">
c6463da87893 Uploaded yhoogstrate parents: diff changeset	74 <validator type="no_options" message="Please select at least one column." />
c6463da87893 Uploaded yhoogstrate parents: diff changeset	75 </param>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	76 </when>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	77 </conditional>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	78
c6463da87893 Uploaded yhoogstrate parents: diff changeset	79 <param name="remove_comment_lines" type="boolean" label="Automatically remove 'comment' lines starting with a '#'" truevale="true" falsevalue="false" selected="true" help="Some tools (incl. featureCounts) include comment lines that are not neccesairy for downstream analyis. By enabling this function, these lines will be removed." />
c6463da87893 Uploaded yhoogstrate parents: diff changeset	80
c6463da87893 Uploaded yhoogstrate parents: diff changeset	81 </inputs>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	82
c6463da87893 Uploaded yhoogstrate parents: diff changeset	83 <outputs>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	84 <data format="tabular" name="expression_matrix" label="Expression matrix" />
c6463da87893 Uploaded yhoogstrate parents: diff changeset	85 </outputs>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	86
c6463da87893 Uploaded yhoogstrate parents: diff changeset	87 <tests>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	88 <test>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	89 <param name="add_geneids.choice" value="true" />
c6463da87893 Uploaded yhoogstrate parents: diff changeset	90 <param name="choice" value="true" />
c6463da87893 Uploaded yhoogstrate parents: diff changeset	91 <param name="add_geneids" value="true" />
c6463da87893 Uploaded yhoogstrate parents: diff changeset	92
c6463da87893 Uploaded yhoogstrate parents: diff changeset	93
c6463da87893 Uploaded yhoogstrate parents: diff changeset	94 <!--
c6463da87893 Uploaded yhoogstrate parents: diff changeset	95 Add a gene-IDs column at the end of the file true
c6463da87893 Uploaded yhoogstrate parents: diff changeset	96 Select Read-count dataset that contains a column for GeneIDs 21: MCF7_featureCounts_E2.txt
c6463da87893 Uploaded yhoogstrate parents: diff changeset	97 Select GeneID column 1
c6463da87893 Uploaded yhoogstrate parents: diff changeset	98 Read-count dataset that belongs to a pair 14: MCF7_featureCounts_Control_1.txt
c6463da87893 Uploaded yhoogstrate parents: diff changeset	99 Select columns that are associated with this factor level 2
c6463da87893 Uploaded yhoogstrate parents: diff changeset	100 Read-count dataset that belongs to a pair 15: MCF7_featureCounts_Control_2.txt
c6463da87893 Uploaded yhoogstrate parents: diff changeset	101 Select columns that are associated with this factor level 2
c6463da87893 Uploaded yhoogstrate parents: diff changeset	102 Read-count dataset that belongs to a pair 16: MCF7_featureCounts_Control_3.txt
c6463da87893 Uploaded yhoogstrate parents: diff changeset	103 Select columns that are associated with this factor level 2
c6463da87893 Uploaded yhoogstrate parents: diff changeset	104 Read-count dataset that belongs to a pair 17: MCF7_featureCounts_Control_4.txt
c6463da87893 Uploaded yhoogstrate parents: diff changeset	105 Select columns that are associated with this factor level 2
c6463da87893 Uploaded yhoogstrate parents: diff changeset	106 Read-count dataset that belongs to a pair 18: MCF7_featureCounts_Control_5.txt
c6463da87893 Uploaded yhoogstrate parents: diff changeset	107 Select columns that are associated with this factor level 2
c6463da87893 Uploaded yhoogstrate parents: diff changeset	108 Read-count dataset that belongs to a pair 22: MCF7_featureCounts_Control_6.txt
c6463da87893 Uploaded yhoogstrate parents: diff changeset	109 Select columns that are associated with this factor level 2
c6463da87893 Uploaded yhoogstrate parents: diff changeset	110 Read-count dataset that belongs to a pair 20: MCF7_featureCounts_Control_7.txt
c6463da87893 Uploaded yhoogstrate parents: diff changeset	111 Select columns that are associated with this factor level 2
c6463da87893 Uploaded yhoogstrate parents: diff changeset	112 Read-count dataset that belongs to a pair 21: MCF7_featureCounts_E2.txt
c6463da87893 Uploaded yhoogstrate parents: diff changeset	113 Select columns that are associated with this factor level 2 3 4 5 6 7 8
c6463da87893 Uploaded yhoogstrate parents: diff changeset	114 Add a gene-lengths column at the end of the file true
c6463da87893 Uploaded yhoogstrate parents: diff changeset	115 Read-count dataset that belongs to a pair 26: MCF7_featureCounts_GeneLengths.txt
c6463da87893 Uploaded yhoogstrate parents: diff changeset	116 Select columns that are associated with this factor level 2
c6463da87893 Uploaded yhoogstrate parents: diff changeset	117 Automatically remove 'comment' lines starting with a '#' False
c6463da87893 Uploaded yhoogstrate parents: diff changeset	118 -->
c6463da87893 Uploaded yhoogstrate parents: diff changeset	119
c6463da87893 Uploaded yhoogstrate parents: diff changeset	120 <output name="expression_matrix" file="MCF7_featureCounts_concatenated.txt" />
c6463da87893 Uploaded yhoogstrate parents: diff changeset	121 </test>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	122 </tests>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	123
c6463da87893 Uploaded yhoogstrate parents: diff changeset	124 <help>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	125 edgeR: Concatenate Expression Matrices
c6463da87893 Uploaded yhoogstrate parents: diff changeset	126
c6463da87893 Uploaded yhoogstrate parents: diff changeset	127 Notes
c6463da87893 Uploaded yhoogstrate parents: diff changeset	128
c6463da87893 Uploaded yhoogstrate parents: diff changeset	129 Make sure the tables have an identical number of columns compared to the number of headers.
c6463da87893 Uploaded yhoogstrate parents: diff changeset	130 If you export tables using R, make sure you set: col.names=NA. Otherwise column may be swapped during concatenation.
c6463da87893 Uploaded yhoogstrate parents: diff changeset	131
c6463da87893 Uploaded yhoogstrate parents: diff changeset	132 References
c6463da87893 Uploaded yhoogstrate parents: diff changeset	133
c6463da87893 Uploaded yhoogstrate parents: diff changeset	134 The test data is coming from: doi: 10.1093/bioinformatics/btt688.
c6463da87893 Uploaded yhoogstrate parents: diff changeset	135 http://www.ncbi.nlm.nih.gov/pubmed/24319002
c6463da87893 Uploaded yhoogstrate parents: diff changeset	136
c6463da87893 Uploaded yhoogstrate parents: diff changeset	137 </help>
c6463da87893 Uploaded yhoogstrate parents: diff changeset	138 </tool>

Mercurial > repos > yhoogstrate > edger_with_design_matrix

annotate edgeR_Concatenate_Expression_Matrices.xml @ 27:c6463da87893 draft