oncodrivefm: tools/oncodrivefm_tool/oncodrivefm

annotate tools/oncodrivefm_tool/oncodrivefm_tool.py @ 2:09f9829f1400

tag

author	Saket Choudhary <saketkc@gmail.com>
date	Wed, 20 Nov 2013 01:47:49 +0530
parents	8447ba178b06
children

rev	line source
0 8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	1 #!/usr/bin/python
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	2 import argparse
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	3 import sys
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	4 import os
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	5 import tempfile
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	6 import shutil
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	7 import subprocess
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	8 import ntpath
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	9
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	10 """
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	11 -h, --help show this help message and exit
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	12 -o PATH, --output-path PATH
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	13 Directory where output files will be written
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	14 -n NAME Analysis name
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	15 --output-format FORMAT
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	16 The FORMAT for the output file
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	17 -N NUMBER, --samplings NUMBER
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	18 Number of samplings to compute the FM bias pvalue
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	19 -e ESTIMATOR, --estimator ESTIMATOR
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	20 Test estimator for computation.
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	21 --gt THRESHOLD, --gene-threshold THRESHOLD
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	22 Minimum number of mutations per gene to compute the FM
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	23 bias
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	24 --pt THRESHOLD, --pathway-threshold THRESHOLD
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	25 Minimum number of mutations per pathway to compute the
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	26 FM bias
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	27 -s SLICES, --slices SLICES
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	28 Slices to process separated by commas
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	29 -m PATH, --mapping PATH
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	30 File with mappings between genes and pathways to be
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	31 analysed
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	32 --save-data The input data matrix will be saved
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	33 --save-analysis The analysis results will be saved
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	34 -j CORES, --cores CORES
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	35 Number of cores to use for calculations. Default is 0
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	36 that means all the available cores
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	37 -D KEY=VALUE Define external parameters to be saved in the results
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	38 -L LEVEL, --log-level LEVEL
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	39 Define log level: debug, info, warn, error, critical,
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	40 notset
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	41 """
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	42 def stop_err( msg ):
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	43 sys.stderr.write( '%s\n' % msg )
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	44 sys.exit()
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	45 def main(params):
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	46 parser = argparse.ArgumentParser()
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	47 ##TAKEN directly from the source code
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	48 parser.add_argument("-N", "--samplings", dest="num_samplings", type=int, default=10000, metavar="NUMBER",
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	49 help="Number of samplings to compute the FM bias pvalue")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	50 parser.add_argument("-e", "--estimator", dest="estimator", metavar="ESTIMATOR",
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	51 choices=["mean", "median"], default="mean",
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	52 help="Test estimator for computation.")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	53 parser.add_argument("--gt", "--gene-threshold", dest="mut_gene_threshold", type=int, default=2, metavar="THRESHOLD",
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	54 help="Minimum number of mutations per gene to compute the FM bias")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	55 parser.add_argument("--pt", "--pathway-threshold", dest="mut_pathway_threshold", type=int, default=10, metavar="THRESHOLD",
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	56 help="Minimum number of mutations per pathway to compute the FM bias")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	57 parser.add_argument("-s", "--slices", dest="slices", metavar="SLICES",
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	58 help="Slices to process separated by commas")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	59 parser.add_argument("-m", "--mapping", dest="mapping", metavar="PATH",
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	60 help="File with mappings between genes and pathways to be analysed")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	61 parser.add_argument("-f", "--filter", dest="filter", metavar="PATH",
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	62 help="File containing the features to be filtered. By default labels are includes,"
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	63 " labels preceded with - are excludes.")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	64 #parser.add_argument("-o", "--output_path", type=str, required=True, help="Directory where output files will be written")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	65 parser.add_argument("-o1", "--output1", type=str, dest="output1", required=True)
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	66
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	67 parser.add_argument("-o2", "--output2", type=str, dest="output2", required=False)
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	68 parser.add_argument("-n", "--analysis_name", type=str, required=False, help="Analysis name")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	69 #parser.add_argument("-e", "--estimator", type=str, required=False, choices=["mean-empirical","median-empirical","mean-zscore","median-zscore"], help="Test estimator for computation")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	70 parser.add_argument("--output-format", dest="output_format", required=False,
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	71 metavar="FORMAT",
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	72 choices=["tsv", "tsv.gz", "tsv.bz2"],
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	73 default="tsv",
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	74 help="The FORMAT for the output file")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	75 parser.add_argument("-j", "--cores", dest="num_cores", type=int,
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	76 metavar="CORES",
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	77 help="Number of cores to use for calculations.\
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	78 Default is 0 that means all the available cores")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	79 parser.add_argument("-D", dest="defines", metavar="KEY=VALUE", action="append", help="Define external parameters to be saved in the results")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	80 parser.add_argument("-L", "--log-level", dest="log_level", metavar="LEVEL", default=None,
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	81 choices=["debug", "info", "warn", "error", "critical", "notset"],
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	82 help="Define log level: debug, info, warn, error, critical, notset")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	83 parser.add_argument("-i", "--input", dest="input_path", required=True, type=str, help="Path to input file")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	84 args = vars(parser.parse_args(params))
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	85 try:
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	86 mapping_path = args["mapping_path"]
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	87 except KeyError:
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	88 mapping_path = "no_mapping_path"
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	89 #if mapping_path=="no_mapping_path":
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	90 #params.remove(mapping_path)
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	91 #params.remove("-m")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	92 output_dir = tempfile.mkdtemp()
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	93 params.append("-o")
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	94 params.append(output_dir)
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	95 params.append(args["input_path"])
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	96 cmd = "oncodrivefm "
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	97 i=0
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	98 while i<len(params):
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	99 p=params[i]
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	100 if p=="-i" or p=="-o1" or p=="-o2":
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	101 i+=2
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	102 else:
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	103 i+=1
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	104 cmd += " "+p
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	105 cmd += " 2>&1 "
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	106 #tmp = tempfile.NamedTemporaryFile( dir=output_dir ).name
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	107 #tmp_stderr = open( tmp, 'wb' )
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	108 print cmd
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	109 proc = subprocess.Popen(args=cmd, shell=True)
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	110 returncode = proc.wait()
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	111 #tmp_stderr.close()
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	112
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	113 if args['analysis_name'] is not None:
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	114 prefix = args["analysis_name"]
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	115 else:
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	116 ##refer: http://stackoverflow.com/a/8384788/756986
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	117 prefix = ntpath.basename(args["input_path"]).split(".")[0]
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	118 if args["mapping"] is not None:
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	119 pathway_file = prefix+"-pathways"
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	120 else:
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	121 pathway_file = None
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	122 output_format = args["output_format"]
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	123 genes_output_file_name = os.path.join(output_dir, prefix+"-genes."+output_format)
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	124 shutil.move(genes_output_file_name,args["output1"])
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	125 if pathway_file:
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	126 pathway_output_file_name = os.path.join(output_dir, pathway_file+"."+output_format)
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	127 shutil.move(pathway_output_file_name,args["output2"])
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	128 if os.path.exists( output_dir ):
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	129 shutil.rmtree( output_dir )
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	130 if __name__=="__main__":
8447ba178b06 Init Saket Choudhary <saketkc@gmail.com> parents: diff changeset	131 main(sys.argv[1:])

Mercurial > repos > saketkc > oncodrivefm

annotate tools/oncodrivefm_tool/oncodrivefm_tool.py @ 2:09f9829f1400