amplicon_analysis_pipeline: Amplicon_analysis-galaxy-update-to-Amplicon_analysis_pipeline-1.3/amplicon_analysis

author	pjbriggs
date	Thu, 05 Dec 2019 11:44:03 +0000
parents
children

rev	line source
41 7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	1 #!/usr/bin/env python
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	2 #
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	3 # Wrapper script to run Amplicon_analysis_pipeline.sh
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	4 # from Galaxy tool
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	5
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	6 import sys
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	7 import os
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	8 import argparse
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	9 import subprocess
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	10 import glob
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	11
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	12 class PipelineCmd(object):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	13 def __init__(self,cmd):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	14 self.cmd = [str(cmd)]
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	15 def add_args(self,*args):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	16 for arg in args:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	17 self.cmd.append(str(arg))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	18 def __repr__(self):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	19 return ' '.join([str(arg) for arg in self.cmd])
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	20
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	21 def ahref(target,name=None,type=None):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	22 if name is None:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	23 name = os.path.basename(target)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	24 ahref = "<a href='%s'" % target
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	25 if type is not None:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	26 ahref += " type='%s'" % type
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	27 ahref += ">%s</a>" % name
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	28 return ahref
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	29
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	30 def check_errors():
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	31 # Errors in Amplicon_analysis_pipeline.log
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	32 with open('Amplicon_analysis_pipeline.log','r') as pipeline_log:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	33 log = pipeline_log.read()
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	34 if "Names in the first column of Metatable.txt and in the second column of Final_name.txt do not match" in log:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	35 print_error("""* Sample IDs don't match dataset names *
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	36
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	37 The sample IDs (first column of the Metatable file) don't match the
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	38 supplied sample names for the input Fastq pairs.
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	39 """)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	40 # Errors in pipeline output
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	41 with open('pipeline.log','r') as pipeline_log:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	42 log = pipeline_log.read()
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	43 if "Errors and/or warnings detected in mapping file" in log:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	44 with open("Metatable_log/Metatable.log","r") as metatable_log:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	45 # Echo the Metatable log file to the tool log
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	46 print_error("""* Error in Metatable mapping file *
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	47
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	48 %s""" % metatable_log.read())
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	49 elif "No header line was found in mapping file" in log:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	50 # Report error to the tool log
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	51 print_error("""* No header in Metatable mapping file *
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	52
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	53 Check you've specified the correct file as the input Metatable""")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	54
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	55 def print_error(message):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	56 width = max([len(line) for line in message.split('\n')]) + 4
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	57 sys.stderr.write("\n%s\n" % (''width))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	58 for line in message.split('\n'):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	59 sys.stderr.write("* %s%s \n" % (line,' '(width-len(line)-4)))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	60 sys.stderr.write("%s\n\n" % (''width))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	61
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	62 def clean_up_name(sample):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	63 # Remove extensions and trailing "_L[0-9]+_001" from
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	64 # Fastq pair names
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	65 sample_name = '.'.join(sample.split('.')[:1])
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	66 split_name = sample_name.split('_')
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	67 if split_name[-1] == "001":
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	68 split_name = split_name[:-1]
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	69 if split_name[-1].startswith('L'):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	70 try:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	71 int(split_name[-1][1:])
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	72 split_name = split_name[:-1]
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	73 except ValueError:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	74 pass
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	75 return '_'.join(split_name)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	76
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	77 def list_outputs(filen=None):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	78 # List the output directory contents
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	79 # If filen is specified then will be the filename to
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	80 # write to, otherwise write to stdout
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	81 if filen is not None:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	82 fp = open(filen,'w')
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	83 else:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	84 fp = sys.stdout
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	85 results_dir = os.path.abspath("RESULTS")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	86 fp.write("Listing contents of output dir %s:\n" % results_dir)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	87 ix = 0
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	88 for d,dirs,files in os.walk(results_dir):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	89 ix += 1
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	90 fp.write("-- %d: %s\n" % (ix,
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	91 os.path.relpath(d,results_dir)))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	92 for f in files:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	93 ix += 1
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	94 fp.write("---- %d: %s\n" % (ix,
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	95 os.path.relpath(f,results_dir)))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	96 # Close output file
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	97 if filen is not None:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	98 fp.close()
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	99
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	100 if __name__ == "__main__":
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	101 # Command line
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	102 print "Amplicon analysis: starting"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	103 p = argparse.ArgumentParser()
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	104 p.add_argument("metatable",
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	105 metavar="METATABLE_FILE",
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	106 help="Metatable.txt file")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	107 p.add_argument("fastq_pairs",
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	108 metavar="SAMPLE_NAME FQ_R1 FQ_R2",
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	109 nargs="+",
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	110 default=list(),
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	111 help="Triplets of SAMPLE_NAME followed by "
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	112 "a R1/R2 FASTQ file pair")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	113 p.add_argument("-g",dest="forward_pcr_primer")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	114 p.add_argument("-G",dest="reverse_pcr_primer")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	115 p.add_argument("-q",dest="trimming_threshold")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	116 p.add_argument("-O",dest="minimum_overlap")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	117 p.add_argument("-L",dest="minimum_length")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	118 p.add_argument("-l",dest="sliding_window_length")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	119 p.add_argument("-P",dest="pipeline",
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	120 choices=["Vsearch","DADA2"],
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	121 type=str,
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	122 default="Vsearch")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	123 p.add_argument("-S",dest="use_silva",action="store_true")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	124 p.add_argument("-H",dest="use_homd",action="store_true")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	125 p.add_argument("-r",dest="reference_data_path")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	126 p.add_argument("-c",dest="categories_file")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	127 args = p.parse_args()
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	128
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	129 # Build the environment for running the pipeline
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	130 print "Amplicon analysis: building the environment"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	131 metatable_file = os.path.abspath(args.metatable)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	132 os.symlink(metatable_file,"Metatable.txt")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	133 print "-- made symlink to Metatable.txt"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	134
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	135 # Link to Categories.txt file (if provided)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	136 if args.categories_file is not None:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	137 categories_file = os.path.abspath(args.categories_file)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	138 os.symlink(categories_file,"Categories.txt")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	139 print "-- made symlink to Categories.txt"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	140
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	141 # Link to FASTQs and construct Final_name.txt file
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	142 sample_names = []
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	143 print "-- making Final_name.txt"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	144 with open("Final_name.txt",'w') as final_name:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	145 fastqs = iter(args.fastq_pairs)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	146 for sample_name,fqr1,fqr2 in zip(fastqs,fastqs,fastqs):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	147 sample_name = clean_up_name(sample_name)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	148 print " %s" % sample_name
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	149 r1 = "%s_R1_.fastq" % sample_name
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	150 r2 = "%s_R2_.fastq" % sample_name
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	151 os.symlink(fqr1,r1)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	152 os.symlink(fqr2,r2)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	153 final_name.write("%s\n" % '\t'.join((r1,sample_name)))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	154 final_name.write("%s\n" % '\t'.join((r2,sample_name)))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	155 sample_names.append(sample_name)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	156
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	157 # Reference database
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	158 if args.use_silva:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	159 ref_database = "silva"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	160 elif args.use_homd:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	161 ref_database = "homd"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	162 else:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	163 ref_database = "gg"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	164
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	165 # Construct the pipeline command
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	166 print "Amplicon analysis: constructing pipeline command"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	167 pipeline = PipelineCmd("Amplicon_analysis_pipeline.sh")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	168 if args.forward_pcr_primer:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	169 pipeline.add_args("-g",args.forward_pcr_primer)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	170 if args.reverse_pcr_primer:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	171 pipeline.add_args("-G",args.reverse_pcr_primer)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	172 if args.trimming_threshold:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	173 pipeline.add_args("-q",args.trimming_threshold)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	174 if args.minimum_overlap:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	175 pipeline.add_args("-O",args.minimum_overlap)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	176 if args.minimum_length:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	177 pipeline.add_args("-L",args.minimum_length)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	178 if args.sliding_window_length:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	179 pipeline.add_args("-l",args.sliding_window_length)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	180 if args.reference_data_path:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	181 pipeline.add_args("-r",args.reference_data_path)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	182 pipeline.add_args("-P",args.pipeline)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	183 if ref_database == "silva":
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	184 pipeline.add_args("-S")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	185 elif ref_database == "homd":
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	186 pipeline.add_args("-H")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	187
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	188 # Echo the pipeline command to stdout
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	189 print "Running %s" % pipeline
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	190
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	191 # Run the pipeline
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	192 with open("pipeline.log","w") as pipeline_out:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	193 try:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	194 subprocess.check_call(pipeline.cmd,
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	195 stdout=pipeline_out,
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	196 stderr=subprocess.STDOUT)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	197 exit_code = 0
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	198 print "Pipeline completed ok"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	199 except subprocess.CalledProcessError as ex:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	200 # Non-zero exit status
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	201 sys.stderr.write("Pipeline failed: exit code %s\n" %
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	202 ex.returncode)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	203 exit_code = ex.returncode
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	204 except Exception as ex:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	205 # Some other problem
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	206 sys.stderr.write("Unexpected error: %s\n" % str(ex))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	207 exit_code = 1
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	208
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	209 # Write out the list of outputs
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	210 outputs_file = "Pipeline_outputs.txt"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	211 list_outputs(outputs_file)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	212
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	213 # Check for log file
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	214 log_file = "Amplicon_analysis_pipeline.log"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	215 if os.path.exists(log_file):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	216 print "Found log file: %s" % log_file
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	217 if exit_code == 0:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	218 # Create an HTML file to link to log files etc
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	219 # NB the paths to the files should be correct once
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	220 # copied by Galaxy on job completion
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	221 with open("pipeline_outputs.html","w") as html_out:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	222 html_out.write("""<html>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	223 <head>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	224 <title>Amplicon analysis pipeline: log files</title>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	225 <head>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	226 <body>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	227 <h1>Amplicon analysis pipeline: log files</h1>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	228 <ul>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	229 """)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	230 html_out.write(
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	231 "<li>%s</li>\n" %
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	232 ahref("Amplicon_analysis_pipeline.log",
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	233 type="text/plain"))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	234 html_out.write(
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	235 "<li>%s</li>\n" %
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	236 ahref("pipeline.log",type="text/plain"))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	237 html_out.write(
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	238 "<li>%s</li>\n" %
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	239 ahref("Pipeline_outputs.txt",
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	240 type="text/plain"))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	241 html_out.write(
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	242 "<li>%s</li>\n" %
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	243 ahref("Metatable.html"))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	244 html_out.write("""<ul>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	245 </body>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	246 </html>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	247 """)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	248 else:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	249 # Check for known error messages
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	250 check_errors()
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	251 # Write pipeline stdout to tool stderr
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	252 sys.stderr.write("\nOutput from pipeline:\n")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	253 with open("pipeline.log",'r') as log:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	254 sys.stderr.write("%s" % log.read())
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	255 # Write log file contents to tool log
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	256 print "\nAmplicon_analysis_pipeline.log:"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	257 with open(log_file,'r') as log:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	258 print "%s" % log.read()
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	259 else:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	260 sys.stderr.write("ERROR missing log file \"%s\"\n" %
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	261 log_file)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	262
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	263 # Handle FastQC boxplots
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	264 print "Amplicon analysis: collating per base quality boxplots"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	265 with open("fastqc_quality_boxplots.html","w") as quality_boxplots:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	266 # PHRED value for trimming
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	267 phred_score = 20
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	268 if args.trimming_threshold is not None:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	269 phred_score = args.trimming_threshold
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	270 # Write header for HTML output file
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	271 quality_boxplots.write("""<html>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	272 <head>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	273 <title>Amplicon analysis pipeline: Per-base Quality Boxplots (FastQC)</title>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	274 <head>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	275 <body>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	276 <h1>Amplicon analysis pipeline: Per-base Quality Boxplots (FastQC)</h1>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	277 """)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	278 # Look for raw and trimmed FastQC output for each sample
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	279 for sample_name in sample_names:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	280 fastqc_dir = os.path.join(sample_name,"FastQC")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	281 quality_boxplots.write("<h2>%s</h2>" % sample_name)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	282 for d in ("Raw","cutdapt_sickle/Q%s" % phred_score):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	283 quality_boxplots.write("<h3>%s</h3>" % d)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	284 fastqc_html_files = glob.glob(
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	285 os.path.join(fastqc_dir,d,"*_fastqc.html"))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	286 if not fastqc_html_files:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	287 quality_boxplots.write("<p>No FastQC outputs found</p>")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	288 continue
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	289 # Pull out the per-base quality boxplots
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	290 for f in fastqc_html_files:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	291 boxplot = None
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	292 with open(f) as fp:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	293 for line in fp.read().split(">"):
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	294 try:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	295 line.index("alt=\"Per base quality graph\"")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	296 boxplot = line + ">"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	297 break
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	298 except ValueError:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	299 pass
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	300 if boxplot is None:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	301 boxplot = "Missing plot"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	302 quality_boxplots.write("<h4>%s</h4><p>%s</p>" %
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	303
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	304 (os.path.basename(f),
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	305 boxplot))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	306 quality_boxplots.write("""</body>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	307 </html>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	308 """)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	309
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	310 # Handle DADA2 error rate plot PDFs
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	311 if args.pipeline == "DADA2":
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	312 print("Amplicon analysis: collecting error rate plots")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	313 error_rate_plots_dir = os.path.abspath(
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	314 os.path.join("DADA2_OTU_tables",
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	315 "Error_rate_plots"))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	316 error_rate_plot_pdfs = [os.path.basename(pdf)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	317 for pdf in
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	318 sorted(glob.glob(
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	319 os.path.join(error_rate_plots_dir,"*.pdf")))]
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	320 with open("error_rate_plots.html","w") as error_rate_plots_out:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	321 error_rate_plots_out.write("""<html>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	322 <head>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	323 <title>Amplicon analysis pipeline: DADA2 Error Rate Plots</title>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	324 <head>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	325 <body>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	326 <h1>Amplicon analysis pipeline: DADA2 Error Rate Plots</h1>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	327 """)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	328 error_rate_plots_out.write("<ul>\n")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	329 for pdf in error_rate_plot_pdfs:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	330 error_rate_plots_out.write("<li>%s</li>\n" % ahref(pdf))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	331 error_rate_plots_out.write("<ul>\n")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	332 error_rate_plots_out.write("""</body>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	333 </html>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	334 """)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	335
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	336 # Handle additional output when categories file was supplied
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	337 if args.categories_file is not None:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	338 # Alpha diversity boxplots
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	339 print "Amplicon analysis: indexing alpha diversity boxplots"
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	340 boxplots_dir = os.path.abspath(
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	341 os.path.join("RESULTS",
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	342 "%s_%s" % (args.pipeline,
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	343 ref_database),
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	344 "Alpha_diversity",
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	345 "Alpha_diversity_boxplot",
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	346 "Categories_shannon"))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	347 print "Amplicon analysis: gathering PDFs from %s" % boxplots_dir
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	348 boxplot_pdfs = [os.path.basename(pdf)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	349 for pdf in
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	350 sorted(glob.glob(
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	351 os.path.join(boxplots_dir,"*.pdf")))]
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	352 with open("alpha_diversity_boxplots.html","w") as boxplots_out:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	353 boxplots_out.write("""<html>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	354 <head>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	355 <title>Amplicon analysis pipeline: Alpha Diversity Boxplots (Shannon)</title>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	356 <head>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	357 <body>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	358 <h1>Amplicon analysis pipeline: Alpha Diversity Boxplots (Shannon)</h1>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	359 """)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	360 boxplots_out.write("<ul>\n")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	361 for pdf in boxplot_pdfs:
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	362 boxplots_out.write("<li>%s</li>\n" % ahref(pdf))
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	363 boxplots_out.write("<ul>\n")
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	364 boxplots_out.write("""</body>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	365 </html>
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	366 """)
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	367
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	368 # Finish
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	369 print "Amplicon analysis: finishing, exit code: %s" % exit_code
7b9786a43a16 Uploaded test version 1.3.5.0. pjbriggs parents: diff changeset	370 sys.exit(exit_code)

41

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

1 #!/usr/bin/env python

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

2 #

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

3 # Wrapper script to run Amplicon_analysis_pipeline.sh

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

4 # from Galaxy tool

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

5

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

6 import sys

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

7 import os

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

8 import argparse

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

9 import subprocess

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

10 import glob

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

11

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

12 class PipelineCmd(object):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

13 def __init__(self,cmd):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

14 self.cmd = [str(cmd)]

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

15 def add_args(self,*args):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

16 for arg in args:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

17 self.cmd.append(str(arg))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

18 def __repr__(self):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

19 return ' '.join([str(arg) for arg in self.cmd])

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

20

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

21 def ahref(target,name=None,type=None):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

22 if name is None:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

23 name = os.path.basename(target)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

24 ahref = "<a href='%s'" % target

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

25 if type is not None:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

26 ahref += " type='%s'" % type

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

27 ahref += ">%s</a>" % name

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

28 return ahref

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

29

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

30 def check_errors():

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

31 # Errors in Amplicon_analysis_pipeline.log

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

32 with open('Amplicon_analysis_pipeline.log','r') as pipeline_log:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

33 log = pipeline_log.read()

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

34 if "Names in the first column of Metatable.txt and in the second column of Final_name.txt do not match" in log:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

35 print_error("""*** Sample IDs don't match dataset names ***

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

36

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

37 The sample IDs (first column of the Metatable file) don't match the

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

38 supplied sample names for the input Fastq pairs.

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

39 """)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

40 # Errors in pipeline output

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

41 with open('pipeline.log','r') as pipeline_log:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

42 log = pipeline_log.read()

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

43 if "Errors and/or warnings detected in mapping file" in log:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

44 with open("Metatable_log/Metatable.log","r") as metatable_log:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

45 # Echo the Metatable log file to the tool log

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

46 print_error("""*** Error in Metatable mapping file ***

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

47

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

48 %s""" % metatable_log.read())

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

49 elif "No header line was found in mapping file" in log:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

50 # Report error to the tool log

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

51 print_error("""*** No header in Metatable mapping file ***

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

52

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

53 Check you've specified the correct file as the input Metatable""")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

54

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

55 def print_error(message):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

56 width = max([len(line) for line in message.split('\n')]) + 4

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

57 sys.stderr.write("\n%s\n" % ('*'*width))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

58 for line in message.split('\n'):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

59 sys.stderr.write("* %s%s *\n" % (line,' '*(width-len(line)-4)))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

60 sys.stderr.write("%s\n\n" % ('*'*width))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

61

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

62 def clean_up_name(sample):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

63 # Remove extensions and trailing "_L[0-9]+_001" from

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

64 # Fastq pair names

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

65 sample_name = '.'.join(sample.split('.')[:1])

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

66 split_name = sample_name.split('_')

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

67 if split_name[-1] == "001":

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

68 split_name = split_name[:-1]

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

69 if split_name[-1].startswith('L'):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

70 try:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

71 int(split_name[-1][1:])

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

72 split_name = split_name[:-1]

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

73 except ValueError:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

74 pass

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

75 return '_'.join(split_name)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

76

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

77 def list_outputs(filen=None):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

78 # List the output directory contents

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

79 # If filen is specified then will be the filename to

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

80 # write to, otherwise write to stdout

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

81 if filen is not None:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

82 fp = open(filen,'w')

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

83 else:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

84 fp = sys.stdout

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

85 results_dir = os.path.abspath("RESULTS")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

86 fp.write("Listing contents of output dir %s:\n" % results_dir)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

87 ix = 0

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

88 for d,dirs,files in os.walk(results_dir):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

89 ix += 1

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

90 fp.write("-- %d: %s\n" % (ix,

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

91 os.path.relpath(d,results_dir)))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

92 for f in files:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

93 ix += 1

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

94 fp.write("---- %d: %s\n" % (ix,

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

95 os.path.relpath(f,results_dir)))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

96 # Close output file

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

97 if filen is not None:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

98 fp.close()

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

99

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

100 if __name__ == "__main__":

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

101 # Command line

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

102 print "Amplicon analysis: starting"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

103 p = argparse.ArgumentParser()

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

104 p.add_argument("metatable",

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

105 metavar="METATABLE_FILE",

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

106 help="Metatable.txt file")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

107 p.add_argument("fastq_pairs",

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

108 metavar="SAMPLE_NAME FQ_R1 FQ_R2",

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

109 nargs="+",

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

110 default=list(),

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

111 help="Triplets of SAMPLE_NAME followed by "

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

112 "a R1/R2 FASTQ file pair")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

113 p.add_argument("-g",dest="forward_pcr_primer")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

114 p.add_argument("-G",dest="reverse_pcr_primer")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

115 p.add_argument("-q",dest="trimming_threshold")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

116 p.add_argument("-O",dest="minimum_overlap")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

117 p.add_argument("-L",dest="minimum_length")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

118 p.add_argument("-l",dest="sliding_window_length")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

119 p.add_argument("-P",dest="pipeline",

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

120 choices=["Vsearch","DADA2"],

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

121 type=str,

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

122 default="Vsearch")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

123 p.add_argument("-S",dest="use_silva",action="store_true")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

124 p.add_argument("-H",dest="use_homd",action="store_true")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

125 p.add_argument("-r",dest="reference_data_path")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

126 p.add_argument("-c",dest="categories_file")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

127 args = p.parse_args()

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

128

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

129 # Build the environment for running the pipeline

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

130 print "Amplicon analysis: building the environment"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

131 metatable_file = os.path.abspath(args.metatable)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

132 os.symlink(metatable_file,"Metatable.txt")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

133 print "-- made symlink to Metatable.txt"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

134

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

135 # Link to Categories.txt file (if provided)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

136 if args.categories_file is not None:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

137 categories_file = os.path.abspath(args.categories_file)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

138 os.symlink(categories_file,"Categories.txt")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

139 print "-- made symlink to Categories.txt"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

140

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

141 # Link to FASTQs and construct Final_name.txt file

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

142 sample_names = []

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

143 print "-- making Final_name.txt"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

144 with open("Final_name.txt",'w') as final_name:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

145 fastqs = iter(args.fastq_pairs)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

146 for sample_name,fqr1,fqr2 in zip(fastqs,fastqs,fastqs):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

147 sample_name = clean_up_name(sample_name)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

148 print " %s" % sample_name

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

149 r1 = "%s_R1_.fastq" % sample_name

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

150 r2 = "%s_R2_.fastq" % sample_name

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

151 os.symlink(fqr1,r1)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

152 os.symlink(fqr2,r2)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

153 final_name.write("%s\n" % '\t'.join((r1,sample_name)))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

154 final_name.write("%s\n" % '\t'.join((r2,sample_name)))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

155 sample_names.append(sample_name)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

156

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

157 # Reference database

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

158 if args.use_silva:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

159 ref_database = "silva"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

160 elif args.use_homd:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

161 ref_database = "homd"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

162 else:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

163 ref_database = "gg"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

164

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

165 # Construct the pipeline command

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

166 print "Amplicon analysis: constructing pipeline command"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

167 pipeline = PipelineCmd("Amplicon_analysis_pipeline.sh")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

168 if args.forward_pcr_primer:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

169 pipeline.add_args("-g",args.forward_pcr_primer)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

170 if args.reverse_pcr_primer:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

171 pipeline.add_args("-G",args.reverse_pcr_primer)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

172 if args.trimming_threshold:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

173 pipeline.add_args("-q",args.trimming_threshold)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

174 if args.minimum_overlap:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

175 pipeline.add_args("-O",args.minimum_overlap)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

176 if args.minimum_length:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

177 pipeline.add_args("-L",args.minimum_length)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

178 if args.sliding_window_length:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

179 pipeline.add_args("-l",args.sliding_window_length)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

180 if args.reference_data_path:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

181 pipeline.add_args("-r",args.reference_data_path)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

182 pipeline.add_args("-P",args.pipeline)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

183 if ref_database == "silva":

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

184 pipeline.add_args("-S")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

185 elif ref_database == "homd":

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

186 pipeline.add_args("-H")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

187

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

188 # Echo the pipeline command to stdout

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

189 print "Running %s" % pipeline

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

190

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

191 # Run the pipeline

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

192 with open("pipeline.log","w") as pipeline_out:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

193 try:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

194 subprocess.check_call(pipeline.cmd,

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

195 stdout=pipeline_out,

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

196 stderr=subprocess.STDOUT)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

197 exit_code = 0

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

198 print "Pipeline completed ok"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

199 except subprocess.CalledProcessError as ex:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

200 # Non-zero exit status

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

201 sys.stderr.write("Pipeline failed: exit code %s\n" %

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

202 ex.returncode)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

203 exit_code = ex.returncode

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

204 except Exception as ex:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

205 # Some other problem

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

206 sys.stderr.write("Unexpected error: %s\n" % str(ex))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

207 exit_code = 1

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

208

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

209 # Write out the list of outputs

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

210 outputs_file = "Pipeline_outputs.txt"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

211 list_outputs(outputs_file)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

212

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

213 # Check for log file

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

214 log_file = "Amplicon_analysis_pipeline.log"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

215 if os.path.exists(log_file):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

216 print "Found log file: %s" % log_file

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

217 if exit_code == 0:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

218 # Create an HTML file to link to log files etc

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

219 # NB the paths to the files should be correct once

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

220 # copied by Galaxy on job completion

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

221 with open("pipeline_outputs.html","w") as html_out:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

222 html_out.write("""<html>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

223 <head>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

224 <title>Amplicon analysis pipeline: log files</title>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

225 <head>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

226 <body>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

227 <h1>Amplicon analysis pipeline: log files</h1>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

228 <ul>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

229 """)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

230 html_out.write(

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

231 "<li>%s</li>\n" %

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

232 ahref("Amplicon_analysis_pipeline.log",

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

233 type="text/plain"))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

234 html_out.write(

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

235 "<li>%s</li>\n" %

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

236 ahref("pipeline.log",type="text/plain"))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

237 html_out.write(

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

238 "<li>%s</li>\n" %

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

239 ahref("Pipeline_outputs.txt",

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

240 type="text/plain"))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

241 html_out.write(

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

242 "<li>%s</li>\n" %

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

243 ahref("Metatable.html"))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

244 html_out.write("""<ul>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

245 </body>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

246 </html>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

247 """)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

248 else:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

249 # Check for known error messages

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

250 check_errors()

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

251 # Write pipeline stdout to tool stderr

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

252 sys.stderr.write("\nOutput from pipeline:\n")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

253 with open("pipeline.log",'r') as log:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

254 sys.stderr.write("%s" % log.read())

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

255 # Write log file contents to tool log

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

256 print "\nAmplicon_analysis_pipeline.log:"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

257 with open(log_file,'r') as log:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

258 print "%s" % log.read()

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

259 else:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

260 sys.stderr.write("ERROR missing log file \"%s\"\n" %

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

261 log_file)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

262

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

263 # Handle FastQC boxplots

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

264 print "Amplicon analysis: collating per base quality boxplots"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

265 with open("fastqc_quality_boxplots.html","w") as quality_boxplots:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

266 # PHRED value for trimming

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

267 phred_score = 20

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

268 if args.trimming_threshold is not None:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

269 phred_score = args.trimming_threshold

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

270 # Write header for HTML output file

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

271 quality_boxplots.write("""<html>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

272 <head>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

273 <title>Amplicon analysis pipeline: Per-base Quality Boxplots (FastQC)</title>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

274 <head>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

275 <body>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

276 <h1>Amplicon analysis pipeline: Per-base Quality Boxplots (FastQC)</h1>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

277 """)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

278 # Look for raw and trimmed FastQC output for each sample

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

279 for sample_name in sample_names:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

280 fastqc_dir = os.path.join(sample_name,"FastQC")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

281 quality_boxplots.write("<h2>%s</h2>" % sample_name)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

282 for d in ("Raw","cutdapt_sickle/Q%s" % phred_score):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

283 quality_boxplots.write("<h3>%s</h3>" % d)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

284 fastqc_html_files = glob.glob(

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

285 os.path.join(fastqc_dir,d,"*_fastqc.html"))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

286 if not fastqc_html_files:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

287 quality_boxplots.write("<p>No FastQC outputs found</p>")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

288 continue

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

289 # Pull out the per-base quality boxplots

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

290 for f in fastqc_html_files:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

291 boxplot = None

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

292 with open(f) as fp:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

293 for line in fp.read().split(">"):

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

294 try:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

295 line.index("alt=\"Per base quality graph\"")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

296 boxplot = line + ">"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

297 break

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

298 except ValueError:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

299 pass

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

300 if boxplot is None:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

301 boxplot = "Missing plot"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

302 quality_boxplots.write("<h4>%s</h4><p>%s</p>" %

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

303

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

304 (os.path.basename(f),

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

305 boxplot))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

306 quality_boxplots.write("""</body>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

307 </html>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

308 """)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

309

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

310 # Handle DADA2 error rate plot PDFs

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

311 if args.pipeline == "DADA2":

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

312 print("Amplicon analysis: collecting error rate plots")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

313 error_rate_plots_dir = os.path.abspath(

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

314 os.path.join("DADA2_OTU_tables",

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

315 "Error_rate_plots"))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

316 error_rate_plot_pdfs = [os.path.basename(pdf)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

317 for pdf in

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

318 sorted(glob.glob(

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

319 os.path.join(error_rate_plots_dir,"*.pdf")))]

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

320 with open("error_rate_plots.html","w") as error_rate_plots_out:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

321 error_rate_plots_out.write("""<html>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

322 <head>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

323 <title>Amplicon analysis pipeline: DADA2 Error Rate Plots</title>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

324 <head>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

325 <body>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

326 <h1>Amplicon analysis pipeline: DADA2 Error Rate Plots</h1>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

327 """)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

328 error_rate_plots_out.write("<ul>\n")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

329 for pdf in error_rate_plot_pdfs:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

330 error_rate_plots_out.write("<li>%s</li>\n" % ahref(pdf))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

331 error_rate_plots_out.write("<ul>\n")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

332 error_rate_plots_out.write("""</body>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

333 </html>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

334 """)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

335

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

336 # Handle additional output when categories file was supplied

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

337 if args.categories_file is not None:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

338 # Alpha diversity boxplots

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

339 print "Amplicon analysis: indexing alpha diversity boxplots"

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

340 boxplots_dir = os.path.abspath(

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

341 os.path.join("RESULTS",

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

342 "%s_%s" % (args.pipeline,

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

343 ref_database),

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

344 "Alpha_diversity",

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

345 "Alpha_diversity_boxplot",

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

346 "Categories_shannon"))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

347 print "Amplicon analysis: gathering PDFs from %s" % boxplots_dir

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

348 boxplot_pdfs = [os.path.basename(pdf)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

349 for pdf in

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

350 sorted(glob.glob(

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

351 os.path.join(boxplots_dir,"*.pdf")))]

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

352 with open("alpha_diversity_boxplots.html","w") as boxplots_out:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

353 boxplots_out.write("""<html>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

354 <head>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

355 <title>Amplicon analysis pipeline: Alpha Diversity Boxplots (Shannon)</title>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

356 <head>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

357 <body>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

358 <h1>Amplicon analysis pipeline: Alpha Diversity Boxplots (Shannon)</h1>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

359 """)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

360 boxplots_out.write("<ul>\n")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

361 for pdf in boxplot_pdfs:

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

362 boxplots_out.write("<li>%s</li>\n" % ahref(pdf))

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

363 boxplots_out.write("<ul>\n")

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

364 boxplots_out.write("""</body>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

365 </html>

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

366 """)

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

367

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

368 # Finish

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

369 print "Amplicon analysis: finishing, exit code: %s" % exit_code

7b9786a43a16 Uploaded test version 1.3.5.0.

pjbriggs

parents:

diff changeset

370 sys.exit(exit_code)

Mercurial > repos > pjbriggs > amplicon_analysis_pipeline

annotate Amplicon_analysis-galaxy-update-to-Amplicon_analysis_pipeline-1.3/amplicon_analysis_pipeline.py @ 41:7b9786a43a16 draft