elastic_fastq_dump: elastic

annotate elastic_tool.Rmd @ 3:9f61c75f17b7 draft

planemo upload

author	mingchen0919
date	Sun, 01 Apr 2018 17:02:08 -0400
parents	1aeef205e648
children

rev	line source
0 28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	1 ---
1 1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	2 title: 'Tool Report'
0 28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	3 output: html_document
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	4 ---
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	5
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	6 <style>
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	7 pre code, pre, code {
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	8 white-space: pre !important;
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	9 overflow-x: scroll !important;
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	10 word-break: keep-all !important;
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	11 word-wrap: initial !important;
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	12 }
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	13 </style>
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	14
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	15 ```{r setup, include=FALSE, warning=FALSE, message=FALSE}
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	16 knitr::opts_chunk$set(error = TRUE)
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	17 ```
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	18
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	19 ## User input
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	20
1 1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	21 ```{r, 'display user input'}
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	22 # get user input and save it into a data frame.
0 28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	23 df = read.table(paste0(Sys.getenv('REPORT_FILES_PATH'), '/options_and_arguments.txt'),
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	24 sep = '\|', header = TRUE)
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	25
1 1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	26 # if the input type is 'path_relative_to_a_tool', prepend A_TOOL_OUTPUT_PATH to the value to make
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	27 # the value a full path.
0 28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	28 if (nrow(df[df$type == 'path_relative_to_a_tool', ]) > 0) {
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	29 for (i in 1:nrow(df[df$type == 'path_relative_to_a_tool', ])) {
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	30 root_path = readLines(df[df$type == 'path_relative_to_a_tool', ][i, 'path_type'])[1]
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	31 df[df$type == 'path_relative_to_a_tool', ][i, 'value'] = paste(root_path,
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	32 df[df$type == 'path_relative_to_a_tool', ][i, 'value'],
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	33 sep = '/')
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	34 }
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	35 }
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	36
1 1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	37 ## display user input as a table
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	38 knitr::kable(df)
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	39 ```
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	40
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	41
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	42 ```{r, 'build script', echo=FALSE}
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	43 ##-------- build script files -----------
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	44
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	45 # get tool name, the first line of the script is always the tool name.
0 28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	46 tool_name = df[df$type == 'tool_name', 'value']
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	47
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	48 # if the number of option/argument pairs is larger than 0, build script file
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	49 df2 = df[df$type != 'tool_name', ]
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	50 if (nrow(df2) > 0) {
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	51 # write tool name as the first line of the script.sh
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	52 # before running the job, cd into the ${REPORT_FILES_PATH} directory
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	53 write(paste0(tool_name, ' \\'),
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	54 paste0(Sys.getenv('REPORT_FILES_PATH'), '/script.sh'))
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	55 df2 = df[df$type != 'tool_name', ]
1 1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	56 write(paste(' ', df2$option, df2$value, '\\', sep = ' '),
0 28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	57 file = paste0(Sys.getenv('REPORT_FILES_PATH'), '/script.sh'),
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	58 append = TRUE )
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	59 # remember that after writing option/argument lines to the script.sh, the last line
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	60 # has an extra newline character '\' which causes a problem. We can either remove that extra
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	61 # '\' or add a new line to the end. We choose to add a new line.
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	62
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	63 # add an extra line to the end to redirect stdout to stdout.txt and stderr to stderr.txt
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	64 write(' > ${REPORT_FILES_PATH}/stdout.txt 2>${REPORT_FILES_PATH}/stderr.txt',
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	65 paste0(Sys.getenv('REPORT_FILES_PATH'), '/script.sh'), append = TRUE)
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	66 } else {
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	67 # if no option/argument input, simply display the help message
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	68 write(paste0(tool_name, ' -h'),
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	69 file = paste0(Sys.getenv('REPORT_FILES_PATH'), '/script.sh'))
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	70 }
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	71 ```
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	72
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	73
1 1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	74 ```{r, 'create paths if they do not exist', echo=FALSE}
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	75 ## if the input type is 'path_relative_to_this_tool', that means
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	76 ## we need to create a directory or file path.
0 28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	77
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	78 # create paths before running the job script
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	79 df_paths = df[df$type == 'path_relative_to_this_tool', ]
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	80
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	81 if (nrow(df_paths) > 0) {
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	82 for (i in 1:nrow(df_paths)) {
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	83 path = paste0(Sys.getenv('REPORT_FILES_PATH'), '/', df_paths[i, 'value'])
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	84 path_type = df_paths[i, 'path_type']
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	85
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	86 # create file paths
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	87 if ((path_type == 'file_path') & !file.exists(path)) {
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	88 dir_path = paste(head(strsplit(path, '/')[[1]], -1), collapse = '/' )
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	89 if (!dir.exists(dir_path)) {
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	90 dir.create(dir_path, recursive = TRUE)
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	91 }
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	92 file.create(path)
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	93 }
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	94
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	95 # create dir paths
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	96 if ((path_type == 'dir_path') & !dir.exists(path)) {
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	97 dir.create(path, recursive = TRUE)
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	98 }
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	99 }
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	100 }
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	101 ```
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	102
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	103
1 1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	104 ```{bash, 'run jobs', echo=FALSE}
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	105 # run job script, always use absolute path.
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	106 # we want to run all jobs within the working path.
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	107 sh ${REPORT_FILES_PATH}/script.sh
0 28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	108 ```
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	109
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	110
1 1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	111 ```{bash, 'display script', results='asis', echo=FALSE}
0 28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	112 echo '## Job script'
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	113 echo ''
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	114 echo ''
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	115 echo '```bash'
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	116 cat ${REPORT_FILES_PATH}/script.sh
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	117 echo '```'
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	118 ```
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	119
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	120
1 1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	121 ```{r, 'display output directory contents', results='asis', echo=FALSE}
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	122 ## after the job is done, we list all files from the output directory.
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	123 ## full relative path to the output directory needs to be displayed.
0 28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	124
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	125 cat('##All output files')
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	126 cat('\n\n')
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	127 all_files = list.files(path = Sys.getenv('REPORT_FILES_PATH'),
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	128 full.names = TRUE,
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	129 recursive = TRUE)
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	130
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	131 for (f in sub(Sys.getenv('REPORT_FILES_PATH'), '.', all_files) ) {
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	132 cat('* [', f, '](', f, ')\n')
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	133 }
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	134 cat('\n')
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	135 ```
28ce9fcb06c7 planemo upload mingchen0919 parents: diff changeset	136
1 1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	137
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	138 ```{r, 'save output directory of this tool', echo=FALSE}
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	139 ## each elastic tool has a galaxy history output which contains the REPORT_FILES_PATH of this tool
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	140 ## so that other tools can reference the outputs from this tool.
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	141
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	142 ## obtain REPORT_FILES_PAHT and save it to a galaxy output.
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	143 database_root = paste(head(strsplit(Sys.getenv('TOOL_LOG'), '/')[[1]], -1), collapse = '/')
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	144 tool_output_dir_id = tail(strsplit(Sys.getenv('REPORT_FILES_PATH'), '/')[[1]], 1)
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	145 tool_output_dir = paste0(database_root, '/', tool_output_dir_id)
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	146 write(tool_output_dir, Sys.getenv('TOOL_OUTPUT_DIR'))
1aeef205e648 planemo upload mingchen0919 parents: 0 diff changeset	147 ```

Mercurial > repos > mingchen0919 > elastic_fastq_dump

annotate elastic_tool.Rmd @ 3:9f61c75f17b7 draft