spp_tool: spp_wrapper.py annotate

annotate spp_wrapper.py @ 16:ea38ad1cfb62 draft default tip

Replace simplejson with json.

author	stemcellcommons
date	Thu, 10 Apr 2014 13:01:06 -0400
parents	64f2784d471f
children

rev	line source
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	1 #purpose: python wrapper to run spp
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	2 #author: Ziru Zhou
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	3 #Date: November 2012
13 64f2784d471f Uploaded modencode-dcc parents: 12 diff changeset	4 #####################
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	5
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	6 import sys, subprocess, tempfile, shutil, glob, os, os.path, gzip
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	7 from galaxy import eggs
16 ea38ad1cfb62 Replace simplejson with json. stemcellcommons parents: 13 diff changeset	8 import json
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	9
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	10 CHUNK_SIZE = 1024
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	11
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	12 def main():
16 ea38ad1cfb62 Replace simplejson with json. stemcellcommons parents: 13 diff changeset	13 options = json.load( open( sys.argv[1] ) )
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	14 output_narrow_peak = sys.argv[2]
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	15 output_region_peak = sys.argv[3]
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	16 output_peakshift_file = sys.argv[4]
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	17 output_rdata_file = sys.argv[5]
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	18 output_plot_file = sys.argv[6]
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	19 output_default_file = sys.argv[7]
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	20 script_path = sys.argv[8]
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	21
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	22 #set file extensions and set mandatory options
12 d063cc917090 Uploaded modencode-dcc parents: 10 diff changeset	23 #======================================================================================
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	24 experiment_name = '_'.join( options['experiment_name'].split() ) #save experiment name
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	25
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	26 chip_file = "%s.bam" % (options['chip_file'])
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	27 subprocess.call(["cp", options['chip_file'], chip_file])
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	28
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	29 cmdline = "Rscript %s/run_spp.R -c=%s" % (script_path, chip_file )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	30 if 'input_file' in options:
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	31 input_file = "%s.bam" % (options['input_file'])
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	32 subprocess.call(["cp", options['input_file'], input_file])
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	33 cmdline = "%s -i=%s" % ( cmdline, input_file )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	34
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	35 #set additional options
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	36 #========================================================================================
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	37 if (options['action'] == "cross_correlation"):
8 2db63ab9b129 Uploaded modencode-dcc parents: 7 diff changeset	38 cmdline = "%s %s %s %s > default_output.txt" % ( cmdline, options['savp'], options['out'], options['rf'] )
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	39 elif (options['action'] == "peak_calling"):
8 2db63ab9b129 Uploaded modencode-dcc parents: 7 diff changeset	40 cmdline = "%s -fdr=%s -npeak=%s %s %s %s %s %s > default_output.txt" % ( cmdline, options['fdr'], options['npeak'], options['savr'], options['savd'], options['savn'], options['savp'], options['rf'] )
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	41 elif (options['action'] == "idr"):
8 2db63ab9b129 Uploaded modencode-dcc parents: 7 diff changeset	42 cmdline = "%s -npeak=%s %s %s %s %s > default_output.txt" % ( cmdline, options['npeak'], options['savr'], options['savp'], options['out'], options['rf'] )
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	43 elif (options['action'] == "custom"):
8 2db63ab9b129 Uploaded modencode-dcc parents: 7 diff changeset	44 cmdline = "%s -s=%s %s -x=%s -fdr=%s -npeak=%s %s %s" % ( cmdline, options['s'], options['speak'], options['x'], options['fdr'], options['npeak'], options['filtchr'], options['rf'] )
2db63ab9b129 Uploaded modencode-dcc parents: 7 diff changeset	45 cmdline = "%s %s %s %s %s %s > default_output.txt" % ( cmdline, options['out'], options['savn'], options['savr'], options['savp'], options['savd'] )
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	46
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	47 #run cmdline
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	48 #========================================================================================
10 c57381059179 Uploaded modencode-dcc parents: 9 diff changeset	49 #tmp_dir = tempfile.mkdtemp()
c57381059179 Uploaded modencode-dcc parents: 9 diff changeset	50 tmp_dir = os.path.dirname(options['chip_file'])
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	51 stderr_name = tempfile.NamedTemporaryFile().name
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	52 proc = subprocess.Popen( args=cmdline, shell=True, cwd=tmp_dir, stderr=open( stderr_name, 'wb' ) )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	53 proc.wait()
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	54
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	55 #Do not terminate if error code, allow dataset (e.g. log) creation and cleanup
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	56 #========================================================================================
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	57 if proc.returncode:
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	58 stderr_f = open( stderr_name )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	59 while True:
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	60 chunk = stderr_f.read( CHUNK_SIZE )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	61 if not chunk:
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	62 stderr_f.close()
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	63 break
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	64 sys.stderr.write( chunk )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	65
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	66
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	67 #determine if the outputs are there, copy them to the appropriate dir and filename
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	68 #========================================================================================
10 c57381059179 Uploaded modencode-dcc parents: 9 diff changeset	69 chip_name = os.path.basename(options['chip_file'])
c57381059179 Uploaded modencode-dcc parents: 9 diff changeset	70 input_name = os.path.basename(options['input_file'])
c57381059179 Uploaded modencode-dcc parents: 9 diff changeset	71
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	72 created_default_file = os.path.join( tmp_dir, "default_output.txt" )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	73 if os.path.exists( created_default_file ):
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	74 shutil.move( created_default_file, output_default_file )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	75
10 c57381059179 Uploaded modencode-dcc parents: 9 diff changeset	76 created_narrow_peak = os.path.join( tmp_dir, "%s_VS_%s.narrowPeak" % (chip_name, input_name) )
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	77 if os.path.exists( created_narrow_peak ):
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	78 shutil.move( created_narrow_peak, output_narrow_peak )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	79
10 c57381059179 Uploaded modencode-dcc parents: 9 diff changeset	80 created_region_peak = os.path.join( tmp_dir, "%s_VS_%s.regionPeak" % (chip_name, input_name) )
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	81 if os.path.exists( created_region_peak ):
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	82 shutil.move( created_region_peak, output_region_peak )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	83
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	84 created_peakshift_file = os.path.join( tmp_dir, "peakshift.txt" )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	85 if os.path.exists( created_peakshift_file ):
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	86 shutil.move( created_peakshift_file, output_peakshift_file )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	87
10 c57381059179 Uploaded modencode-dcc parents: 9 diff changeset	88 created_rdata_file = os.path.join( tmp_dir, "%s.Rdata" % chip_name )
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	89 if os.path.exists( created_rdata_file ):
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	90 shutil.move( created_rdata_file, output_rdata_file )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	91
10 c57381059179 Uploaded modencode-dcc parents: 9 diff changeset	92 created_plot_file = os.path.join( tmp_dir, "%s.pdf" % chip_name )
7 cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	93 if os.path.exists( created_plot_file ):
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	94 shutil.move( created_plot_file, output_plot_file )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	95
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	96
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	97 os.unlink( stderr_name )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	98 #os.rmdir( tmp_dir )
cbbc26d6ca30 Uploaded modencode-dcc parents: diff changeset	99
16 ea38ad1cfb62 Replace simplejson with json. stemcellcommons parents: 13 diff changeset	100 if __name__ == "__main__": main()

Mercurial > repos > stemcellcommons > spp_tool

annotate spp_wrapper.py @ 16:ea38ad1cfb62 draft default tip