edger_with_design_matrix: edgeR_Differential_Gene

annotate edgeR_Differential_Gene_Expression.xml @ 31:9e9b98a1cb12 draft

Uploaded

author	yhoogstrate
date	Tue, 20 May 2014 05:28:50 -0400
parents	27efc93c1ca6
children	87bf067cfc53

rev	line source
25 7cb518091b18 Uploaded yhoogstrate parents: diff changeset	1 <?xml version="1.0" encoding="UTF-8"?>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	2 <tool id="edger_dge" name="edgeR: Differential Gene(Expression) Analysis">
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	3 <description>RNA-Seq gene expression analysis using edgeR (R package)</description>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	4
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	5 <requirements>
29 27efc93c1ca6 Uploaded yhoogstrate parents: 25 diff changeset	6 <requirement type="package" version="3.0.3">package_r_3_0_3</requirement>
27efc93c1ca6 Uploaded yhoogstrate parents: 25 diff changeset	7 <requirement type="package" version="latest">package_biocLite_edgeR_limma</requirement>
25 7cb518091b18 Uploaded yhoogstrate parents: diff changeset	8 </requirements>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	9
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	10 <command>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	11 <!--
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	12 The following script is written in the "Cheetah" language:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	13 http://www.cheetahtemplate.org/docs/users_guide_html_multipage/contents.html
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	14 -->
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	15
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	16 R --vanilla --slave -f $R_script '--args
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	17 $expression_matrix
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	18 $design_matrix
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	19 $contrast
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	20
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	21 $fdr
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	22
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	23 $output_count_edgeR
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	24 $output_cpm
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	25
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	26 /dev/null <!-- Calculation of FPKM/RPKM should come here -->
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	27
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	28 #if $output_raw_counts:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	29 $output_raw_counts
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	30 #else:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	31 /dev/null
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	32 #end if
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	33
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	34 #if $output_MDSplot:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	35 $output_MDSplot
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	36 #else:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	37 /dev/null
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	38 #end if
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	39
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	40 #if $output_BCVplot:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	41 $output_BCVplot
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	42 #else:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	43 /dev/null
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	44 #end if
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	45
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	46 #if $output_MAplot:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	47 $output_MAplot
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	48 #else:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	49 /dev/null
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	50 #end if
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	51
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	52 #if $output_PValue_distribution_plot:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	53 $output_PValue_distribution_plot
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	54 #else:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	55 /dev/null
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	56 #end if
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	57
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	58 #if $output_hierarchical_clustering_plot:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	59 $output_hierarchical_clustering_plot
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	60 #else:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	61 /dev/null
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	62 #end if
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	63
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	64 #if $output_heatmap_plot:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	65 $output_heatmap_plot
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	66 #else:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	67 /dev/null
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	68 #end if
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	69
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	70 #if $output_RData_obj:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	71 $output_RData_obj
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	72 #else:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	73 /dev/null
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	74 #end if
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	75 '
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	76 #if $output_R:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	77 > $output_R
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	78 #else:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	79 > /dev/null
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	80 #end if
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	81
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	82 2> stderr.txt
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	83 ;
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	84 grep -v 'Calculating library sizes from column' stderr.txt 1>&2
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	85
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	86 </command>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	87
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	88 <inputs>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	89 <param name="expression_matrix" type="data" format="tabular" label="Expression (read count) matrix" />
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	90 <param name="design_matrix" type="data" format="tabular" label="Design matrix" hepl="Ensure your samplenames are identical to those in the expression matrix. Preferentially, create the contrast matrix using 'edgeR: Design- from Expression matrix'." />
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	91
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	92 <param name="contrast" type="text" label="Contrast (biological question)" help="e.g. 'tumor-normal' or '(G1+G2)/2-G3' using the factors chosen in the design matrix. Read the 'makeContrasts' manual from Limma package for more info: http://www.bioconductor.org/packages/release/bioc/html/limma.html and http://www.bioconductor.org/packages/release/bioc/vignettes/limma/inst/doc/usersguide.pdf." />
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	93
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	94 <param name="fdr" type="float" min="0" max="1" value="0.05" label="False Discovery Rate (FDR)" />
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	95
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	96 <param name="outputs" type="select" label="Optional desired outputs" multiple="true" display="checkboxes">
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	97 <option value="make_output_raw_counts">Raw counts table</option>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	98 <option value="make_output_MDSplot">MDS-plot</option>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	99 <option value="make_output_BCVplot">BCV-plot</option>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	100 <option value="make_output_MAplot">MA-plot</option>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	101 <option value="make_output_PValue_distribution_plot">P-Value distribution plot</option>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	102 <option value="make_output_hierarchical_clustering_plot">Hierarchical custering</option>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	103 <option value="make_output_heatmap_plot">Heatmap</option>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	104
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	105 <option value="make_output_R">R stdout</option>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	106 <option value="make_output_RData_obj">R Data object</option>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	107 </param>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	108 </inputs>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	109
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	110 <configfiles>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	111 <configfile name="R_script">
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	112 library(limma,quietly=TRUE) ## enable quietly to avoid unnecessaity stderr dumping
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	113 library(edgeR,quietly=TRUE) ## enable quietly to avoid unnecessaity stderr dumping
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	114 library(splines,quietly=TRUE) ## enable quietly to avoid unnecessaity stderr dumping
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	115
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	116 ## Fetch commandline arguments
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	117 args <- commandArgs(trailingOnly = TRUE)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	118
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	119 expression_matrix_file = args[1]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	120 design_matrix_file = args[2]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	121 contrast = args[3]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	122
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	123 fdr = args[4]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	124
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	125 output_count_edgeR = args[5]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	126 output_cpm = args[6]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	127
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	128 output_xpkm = args[7] ##FPKM file - yet to be implemented
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	129
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	130 output_raw_counts = args[8]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	131 output_MDSplot = args[9]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	132 output_BCVplot = args[10]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	133 output_MAplot = args[11]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	134 output_PValue_distribution_plot = args[12]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	135 output_hierarchical_clustering_plot = args[13]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	136 output_heatmap_plot = args[14]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	137 output_RData_obj = args[15]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	138
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	139
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	140 library(edgeR)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	141 ##raw_data <- read.delim(designmatrix,header=T,stringsAsFactors=T)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	142 ## Obtain read-counts
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	143
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	144 expression_matrix <- read.delim(expression_matrix_file,header=T,stringsAsFactors=F,row.names=1,check.names=FALSE,na.strings=c(""))
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	145 design_matrix <- read.delim(design_matrix_file,header=T,stringsAsFactors=F,row.names=1,check.names=FALSE,na.strings=c(""))
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	146
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	147 colnames(design_matrix) <- make.names(colnames(design_matrix))
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	148
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	149 for(i in 1:ncol(design_matrix)) {
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	150 old = design_matrix[,i]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	151 design_matrix[,i] = make.names(design_matrix[,i])
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	152 if(paste(design_matrix[,i],collapse="\t") != paste(old,collapse="\t")) {
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	153 print("Renaming of factors:")
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	154 print(old)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	155 print("To:")
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	156 print(design_matrix[,i])
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	157 }
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	158 design_matrix[,i] <- as.factor(design_matrix[,i])
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	159 }
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	160
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	161
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	162 columns <- match(rownames(design_matrix),colnames(expression_matrix))
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	163 read_counts <- expression_matrix[,columns]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	164
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	165
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	166 ## Filter for HTSeq predifined counts:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	167 exclude_HTSeq <- c("no_feature","ambiguous","too_low_aQual","not_aligned","alignment_not_unique")
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	168 exclude_DEXSeq <- c("_ambiguous","_empty","_lowaqual","_notaligned")
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	169
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	170 exclude = match(c(exclude_HTSeq, exclude_DEXSeq),rownames(read_counts))
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	171 exclude = exclude[is.na(exclude)==0]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	172 if(length(exclude) != 0) {
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	173 read_counts = read_counts[-exclude,]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	174 }
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	175
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	176
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	177 empty_samples = apply(read_counts,2,function(x) sum(x) == 0)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	178 if(sum(empty_samples) > 0) {
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	179 write(paste("There are ",sum(empty_samples)," empty samples found:",sep=""),stderr())
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	180 write(colnames(read_counts)[empty_samples],stderr())
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	181 } else {
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	182
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	183 dge <- DGEList(counts=read_counts,genes=rownames(read_counts))
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	184
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	185 formula <- paste(c("~0",make.names(colnames(design_matrix))),collapse = " + ")
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	186 design_matrix_tmp <- design_matrix
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	187 colnames(design_matrix_tmp) <- make.names(colnames(design_matrix_tmp))
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	188 design <- model.matrix(as.formula(formula),design_matrix_tmp)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	189 rm(design_matrix_tmp)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	190
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	191 # Filter prefixes
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	192 prefixes = colnames(design_matrix)[attr(design,"assign")]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	193 avoid = nchar(prefixes) == nchar(colnames(design))
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	194 replacements = substr(colnames(design),nchar(prefixes)+1,nchar(colnames(design)))
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	195 replacements[avoid] = colnames(design)[avoid]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	196 colnames(design) = replacements
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	197
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	198 # Do normalization
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	199 write("Calculating normalization factors...",stdout())
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	200 dge <- calcNormFactors(dge)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	201 write("Estimating common dispersion...",stdout())
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	202 dge <- estimateGLMCommonDisp(dge,design)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	203 write("Estimating trended dispersion...",stdout())
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	204 dge <- estimateGLMTrendedDisp(dge,design)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	205 write("Estimating tagwise dispersion...",stdout())
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	206 dge <- estimateGLMTagwiseDisp(dge,design)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	207
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	208
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	209 if(output_MDSplot != "/dev/null") {
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	210 write("Creating MDS plot",stdout())
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	211 ##points <- plotMDS(dge,method="bcv",labels=rep("",nrow(dge\$samples)))# Get coordinates of unflexible plot
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	212 points <- plotMDS.DGEList(dge,labels=rep("",nrow(dge\$samples)))# Get coordinates of unflexible plot
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	213 dev.off()# Kill it
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	214
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	215 pdf(output_MDSplot)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	216 diff_x <- abs(max(points\$x)-min(points\$x))
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	217 diff_y <-(max(points\$y)-min(points\$y))
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	218 plot(c(min(points\$x),max(points\$x) + 0.45 * diff_x), c(min(points\$y) - 0.05 * diff_y,max(points\$y) + 0.05 * diff_y), main="edgeR MDS Plot",type="n", xlab="BCV distance 1", ylab="BCV distance 2")
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	219 points(points\$x,points\$y,pch=20)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	220 text(points\$x, points\$y,rownames(dge\$samples),cex=0.7,col="gray",pos=4)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	221 rm(diff_x,diff_y)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	222
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	223 dev.off()
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	224 }
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	225
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	226 if(output_BCVplot != "/dev/null") {
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	227 write("Creating Biological coefficient of variation plot",stdout())
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	228 pdf(output_BCVplot)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	229 plotBCV(dge, cex=0.4, main="edgeR: Biological coefficient of variation (BCV) vs abundance")
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	230 dev.off()
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	231 }
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	232
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	233
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	234 write("Fitting GLM...",stdout())
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	235 fit <- glmFit(dge,design)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	236
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	237 write(paste("Performing likelihood ratio test: ",contrast,sep=""),stdout())
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	238 cont <- c(contrast)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	239 cont <- makeContrasts(contrasts=cont, levels=design)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	240
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	241 lrt <- glmLRT(fit, contrast=cont[,1])
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	242 write(paste("Exporting to file: ",output_count_edgeR,sep=""),stdout())
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	243 write.table(file=output_count_edgeR,topTags(lrt,n=nrow(read_counts))\$table,sep="\t",row.names=TRUE,col.names=NA)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	244 write.table(file=output_cpm,cpm(dge,normalized.lib.sizes=TRUE),sep="\t",row.names=TRUE,col.names=NA)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	245
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	246 ## todo EXPORT FPKM
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	247 write.table(file=output_raw_counts,dge\$counts,sep="\t",row.names=TRUE,col.names=NA)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	248
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	249
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	250 if(output_MAplot != "/dev/null") {
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	251 write("Creating MA plot...",stdout())
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	252
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	253 etable <- topTags(lrt, n=nrow(dge))\$table
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	254 etable <- etable[order(etable\$FDR), ]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	255 pdf(output_MAplot)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	256 with(etable, plot(logCPM, logFC, pch=20, main="edgeR: Fold change vs abundance"))
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	257 with(subset(etable, FDR < fdr), points(logCPM, logFC, pch=20, col="red"))
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	258 abline(h=c(-1,1), col="blue")
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	259 dev.off()
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	260 }
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	261
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	262 if(output_PValue_distribution_plot != "/dev/null") {
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	263 write("Creating P-value distribution plot...",stdout())
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	264 pdf(output_PValue_distribution_plot)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	265 expressed_genes <- subset(etable, PValue < 0.99)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	266 h <- hist(expressed_genes\$PValue,breaks=nrow(expressed_genes)/15,main="Binned P-Values (< 0.99)")
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	267 center <- sum(h\$counts) / length(h\$counts)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	268 lines(c(0,1),c(center,center),lty=2,col="red",lwd=2)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	269 k <- ksmooth(h\$mid, h\$counts)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	270 lines(k\$x,k\$y,col="red",lwd=2)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	271 rmsd <- (h\$counts) - center
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	272 rmsd <- rmsd^2
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	273 rmsd <- sum(rmsd)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	274 rmsd <- sqrt(rmsd)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	275 text(0,max(h\$counts),paste("e=",round(rmsd,2),sep=""),pos=4,col="blue")
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	276 ## change e into epsilon somehow
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	277 dev.off()
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	278 }
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	279
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	280 ##output_hierarchical_clustering_plot = args[13]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	281 ##output_heatmap_plot = args[14]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	282
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	283 if(output_RData_obj != "/dev/null/") {
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	284 save.image(output_RData_obj)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	285 }
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	286
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	287 write("Done!",stdout())
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	288 }
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	289 </configfile>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	290 </configfiles>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	291
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	292 <outputs>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	293 <data format="tabular" name="output_count_edgeR" label="edgeR DGE on ${design_matrix.hid}: ${design_matrix.name} - differtially expressed genes" />
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	294 <data format="tabular" name="output_cpm" label="edgeR DGE on ${design_matrix.hid}: ${design_matrix.name} - CPM" />
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	295
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	296 <data format="tabular" name="output_raw_counts" label="edgeR DGE on ${design_matrix.hid}: ${design_matrix.name} - raw counts">
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	297 <filter>("make_output_raw_counts" in outputs)</filter>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	298 </data>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	299
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	300 <data format="pdf" name="output_MDSplot" label="edgeR DGE on ${design_matrix.hid}: ${design_matrix.name} - MDS-plot">
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	301 <filter>("make_output_MDSplot" in outputs)</filter>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	302 </data>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	303
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	304 <data format="pdf" name="output_BCVplot" label="edgeR DGE on ${design_matrix.hid}: ${design_matrix.name} - BCV-plot">
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	305 <filter>("make_output_BCVplot" in outputs)</filter>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	306 </data>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	307
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	308 <data format="pdf" name="output_MAplot" label="edgeR DGE on ${design_matrix.hid}: ${design_matrix.name} - MA-plot">
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	309 <filter>("make_output_MAplot" in outputs)</filter>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	310 </data>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	311
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	312 <data format="pdf" name="output_PValue_distribution_plot" label="edgeR DGE on ${design_matrix.hid}: ${design_matrix.name} - P-Value distribution">
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	313 <filter>("make_output_PValue_distribution_plot" in outputs)</filter>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	314 </data>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	315
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	316 <data format="pdf" name="output_hierarchical_clustering_plot" label="edgeR DGE on ${design_matrix.hid}: ${design_matrix.name} - Hierarchical custering">
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	317 <filter>("make_output_hierarchical_clustering_plot" in outputs)</filter>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	318 </data>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	319
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	320 <data format="pdf" name="output_heatmap_plot" label="edgeR DGE on ${design_matrix.hid}: ${design_matrix.name} - Heatmap">
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	321 <filter>("make_output_heatmap_plot" in outputs)</filter>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	322 </data>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	323
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	324 <data format="RData" name="output_RData_obj" label="edgeR DGE on ${design_matrix.hid}: ${design_matrix.name} - R data object">
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	325 <filter>("make_output_R" in outputs)</filter>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	326 </data>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	327
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	328 <data format="txt" name="output_R" label="edgeR DGE on ${design_matrix.hid}: ${design_matrix.name} - R output" >
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	329 <filter>("make_output_RData_obj" in outputs)</filter>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	330 </data>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	331 </outputs>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	332
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	333 <help>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	334 edgeR: Differential Gene(Expression) Analysis
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	335
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	336 Overview
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	337
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	338 Differential expression analysis of RNA-seq and digital gene expression profiles with biological replication. Uses empirical Bayes estimation and exact tests based on the negative binomial distribution. Also useful for differential signal analysis with other types of genome-scale count data.
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	339 Author: Mark Robinson, Davis McCarthy, Yunshun Chen, Aaron Lun & Gordon Smyth
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	340
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	341 http://www.bioconductor.org/packages/2.12/bioc/html/edgeR.html
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	342 http://dx.doi.org/10.1093/bioinformatics/btp616
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	343
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	344 For every experiment, the algorithm requires a design matrix. This matrix describes which samples belong to which groups.
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	345 More details on this are given in the edgeR manual:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	346 http://www.bioconductor.org/packages/2.12/bioc/vignettes/edgeR/inst/doc/edgeRUsersGuide.pdf
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	347 and the limma manual.
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	348
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	349 Because the creation of a design matrix can be complex and time consuming, especially if no GUI is used, this package comes with an alternative tool which can help you with it.
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	350 This tool is called edgeR Design Matrix Creator.
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	351 If the appropriate design matrix (with corresponding links to the files) is given,
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	352 the correct contrast ( http://en.wikipedia.org/wiki/Contrast_(statistics) ) has to be given.
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	353
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	354 If you have for example two groups, with an equal weight, you would like to compare either
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	355 "g1~g2" or "normal~cancer".
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	356
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	357 Input
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	358
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	359 Expression matrix::
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	360
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	361 Geneid "\t" Sample-1 "\t" Sample-2 "\t" Sample-3 "\t" Sample-4 [...] "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	362 SMURF "\t" 123 "\t" 21 "\t" 34545 "\t" 98 ... "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	363 BRCA1 "\t" 435 "\t" 6655 "\t" 45 "\t" 55 ... "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	364 LINK33 "\t" 4 "\t" 645 "\t" 345 "\t" 1 ... "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	365 SNORD78 "\t" 498 "\t" 65 "\t" 98 "\t" 27 ... "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	366 [...]
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	367
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	368 Note: Make sure the number of columns in the header is identical to the number of columns in the body.
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	369
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	370 Design matrix::
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	371
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	372 Sample "\t" Condition "\t" Ethnicity "\t" Patient "\t" Batch "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	373 Sample-1 "\t" Tumor "\t" European "\t" 1 "\t" 1 "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	374 Sample-2 "\t" Normal "\t" European "\t" 1 "\t" 1 "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	375 Sample-3 "\t" Tumor "\t" European "\t" 2 "\t" 1 "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	376 Sample-4 "\t" Normal "\t" European "\t" 2 "\t" 1 "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	377 Sample-5 "\t" Tumor "\t" African "\t" 3 "\t" 1 "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	378 Sample-6 "\t" Normal "\t" African "\t" 3 "\t" 1 "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	379 Sample-7 "\t" Tumor "\t" African "\t" 4 "\t" 2 "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	380 Sample-8 "\t" Normal "\t" African "\t" 4 "\t" 2 "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	381 Sample-9 "\t" Tumor "\t" Asian "\t" 5 "\t" 2 "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	382 Sample-10 "\t" Normal "\t" Asian "\t" 5 "\t" 2 "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	383 Sample-11 "\t" Tumor "\t" Asian "\t" 6 "\t" 2 "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	384 Sample-12 "\t" Normal "\t" Asian "\t" 6 "\t" 2 "\n"
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	385
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	386 Note: Avoid factor names that are (1) numerical, (2) contain mathematical symbols and preferebly only use letters.
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	387
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	388 Contrast::
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	389
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	390 Tumor-Normal
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	391 African-European
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	392 0.5*(Control+Placebo) / Treated
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	393
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	394
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	395 Installation
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	396
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	397 This tool requires no specific configurations. The following dependencies are installed automatically:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	398 * R
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	399 * Bioconductor
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	400 - limma
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	401 - edgeR
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	402
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	403 License
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	404 - R - GPL-2 & GPL-3
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	405 - limma - GPL (>=2)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	406 - edgeR - GPL (>=2)
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	407
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	408 Contact
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	409
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	410 The tool wrapper has been written by Youri Hoogstrate from the Erasmus Medical Center (Rotterdam, Netherlands) on behalf of the Translational Research IT (TraIT) project:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	411 http://www.ctmm.nl/en/programmas/infrastructuren/traitprojecttranslationeleresearch
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	412
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	413 More tools by the Translational Research IT (TraIT) project can be found in the following repository:
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	414 http://toolshed.nbic.nl/
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	415
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	416 References
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	417
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	418 The test data is coming from: doi: 10.1093/bioinformatics/btt688.
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	419 http://www.ncbi.nlm.nih.gov/pubmed/24319002
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	420
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	421 </help>
7cb518091b18 Uploaded yhoogstrate parents: diff changeset	422 </tool>

Mercurial > repos > yhoogstrate > edger_with_design_matrix

annotate edgeR_Differential_Gene_Expression.xml @ 31:9e9b98a1cb12 draft