ncproseq_1_6_5_docker: ncPRO-PROFILING.sh annotate

annotate ncPRO-PROFILING.sh @ 13:8a50d975ad4d draft default tip

Uploaded

author	jbrayet
date	Thu, 28 Jan 2016 09:33:22 -0500
parents	b21296a98eb2
children

rev	line source
1 b21296a98eb2 Uploaded jbrayet parents: diff changeset	1 #!/bin/bash
b21296a98eb2 Uploaded jbrayet parents: diff changeset	2
b21296a98eb2 Uploaded jbrayet parents: diff changeset	3 # Copyleft ↄ⃝ 2012 Institut Curie
b21296a98eb2 Uploaded jbrayet parents: diff changeset	4 # Author(s): Jocelyn Brayet, Laurene Syx, Chongjian Chen, Nicolas Servant(Institut Curie) 2012 - 2015
b21296a98eb2 Uploaded jbrayet parents: diff changeset	5 # Contact: bioinfo.ncproseq@curie.fr
b21296a98eb2 Uploaded jbrayet parents: diff changeset	6 # This software is distributed without any guarantee under the terms of the GNU General
b21296a98eb2 Uploaded jbrayet parents: diff changeset	7 # Public License, either Version 2, June 1991 or Version 3, June 2007.
b21296a98eb2 Uploaded jbrayet parents: diff changeset	8
b21296a98eb2 Uploaded jbrayet parents: diff changeset	9 while getopts "i:g:t:e:l:o:p:r:n:" optionName; do
b21296a98eb2 Uploaded jbrayet parents: diff changeset	10 case "$optionName" in
b21296a98eb2 Uploaded jbrayet parents: diff changeset	11
b21296a98eb2 Uploaded jbrayet parents: diff changeset	12 i) INPUT="$OPTARG";;
b21296a98eb2 Uploaded jbrayet parents: diff changeset	13 g) GENOME="$OPTARG";;
b21296a98eb2 Uploaded jbrayet parents: diff changeset	14 t) DATATYPE="$OPTARG";;
b21296a98eb2 Uploaded jbrayet parents: diff changeset	15 e) EXT="$OPTARG";;
b21296a98eb2 Uploaded jbrayet parents: diff changeset	16 l) LOG_FILE="$OPTARG";;
b21296a98eb2 Uploaded jbrayet parents: diff changeset	17 o) OUT_AB="$OPTARG";;
b21296a98eb2 Uploaded jbrayet parents: diff changeset	18 p) OUT_DIS="$OPTARG";;
b21296a98eb2 Uploaded jbrayet parents: diff changeset	19 r) ROOT_DIR="$OPTARG";;
b21296a98eb2 Uploaded jbrayet parents: diff changeset	20 n) PROJECTNAME="$OPTARG";;
b21296a98eb2 Uploaded jbrayet parents: diff changeset	21
b21296a98eb2 Uploaded jbrayet parents: diff changeset	22 esac
b21296a98eb2 Uploaded jbrayet parents: diff changeset	23 done
b21296a98eb2 Uploaded jbrayet parents: diff changeset	24
b21296a98eb2 Uploaded jbrayet parents: diff changeset	25 ##### ncPRO-seq annotation - Galaxy #####
b21296a98eb2 Uploaded jbrayet parents: diff changeset	26
b21296a98eb2 Uploaded jbrayet parents: diff changeset	27 GENOME_2=`echo $GENOME \| cut -d"_" -f2`
b21296a98eb2 Uploaded jbrayet parents: diff changeset	28
b21296a98eb2 Uploaded jbrayet parents: diff changeset	29 databasePath=$ROOT_DIR/database/files
b21296a98eb2 Uploaded jbrayet parents: diff changeset	30
b21296a98eb2 Uploaded jbrayet parents: diff changeset	31 mkdir -p $databasePath/ncproseqAnnotation
b21296a98eb2 Uploaded jbrayet parents: diff changeset	32 mkdir -p $databasePath/ncproseqAnnotation/annotation
b21296a98eb2 Uploaded jbrayet parents: diff changeset	33 annotationPath=$databasePath/ncproseqAnnotation/annotation
b21296a98eb2 Uploaded jbrayet parents: diff changeset	34 [ ! -d $annotationPath/$GENOME_2 ] && wget http://ncpro.curie.fr/ncproseq/install_dir/annotation/$GENOME.tar.gz -P $annotationPath && cd $annotationPath && tar -zxf $GENOME.tar.gz && rm -rf $GENOME.tar.gz
b21296a98eb2 Uploaded jbrayet parents: diff changeset	35
b21296a98eb2 Uploaded jbrayet parents: diff changeset	36 #########
b21296a98eb2 Uploaded jbrayet parents: diff changeset	37
b21296a98eb2 Uploaded jbrayet parents: diff changeset	38 OUTPUT_PATH_DIR=`dirname $OUT_AB`
b21296a98eb2 Uploaded jbrayet parents: diff changeset	39 OUTPUT_PATH_NAME=`basename $OUT_AB .dat`
b21296a98eb2 Uploaded jbrayet parents: diff changeset	40
b21296a98eb2 Uploaded jbrayet parents: diff changeset	41 OUTPUT_PATH="${OUTPUT_PATH_DIR}/${OUTPUT_PATH_NAME}_files"
b21296a98eb2 Uploaded jbrayet parents: diff changeset	42
b21296a98eb2 Uploaded jbrayet parents: diff changeset	43 mkdir -p $OUTPUT_PATH
b21296a98eb2 Uploaded jbrayet parents: diff changeset	44
b21296a98eb2 Uploaded jbrayet parents: diff changeset	45 VERSION=`echo $OUTPUT_PATH \| cut -d"/" -f3`
b21296a98eb2 Uploaded jbrayet parents: diff changeset	46 VERSION=`echo $VERSION \| cut -d"_" -f2`
b21296a98eb2 Uploaded jbrayet parents: diff changeset	47
b21296a98eb2 Uploaded jbrayet parents: diff changeset	48 #DEBUG_MODE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	49
b21296a98eb2 Uploaded jbrayet parents: diff changeset	50 DEBUG_MODE="on"
b21296a98eb2 Uploaded jbrayet parents: diff changeset	51 DEBUG="/dev/null"
b21296a98eb2 Uploaded jbrayet parents: diff changeset	52
b21296a98eb2 Uploaded jbrayet parents: diff changeset	53 if [[ $DEBUG_MODE == "on" ]];then
b21296a98eb2 Uploaded jbrayet parents: diff changeset	54
b21296a98eb2 Uploaded jbrayet parents: diff changeset	55 DEBUG="$OUTPUT_PATH/ncPRO-ANNOTATION.debug"
b21296a98eb2 Uploaded jbrayet parents: diff changeset	56
b21296a98eb2 Uploaded jbrayet parents: diff changeset	57 fi
b21296a98eb2 Uploaded jbrayet parents: diff changeset	58
b21296a98eb2 Uploaded jbrayet parents: diff changeset	59 #Deploy ncPRO directories structure
b21296a98eb2 Uploaded jbrayet parents: diff changeset	60
b21296a98eb2 Uploaded jbrayet parents: diff changeset	61 /usr/curie_ngs/ncproseq_v1.6.5/bin/ncPRO-deploy -o $OUTPUT_PATH > $DEBUG
b21296a98eb2 Uploaded jbrayet parents: diff changeset	62
b21296a98eb2 Uploaded jbrayet parents: diff changeset	63 #me
b21296a98eb2 Uploaded jbrayet parents: diff changeset	64 chmod 777 -R $OUTPUT_PATH
b21296a98eb2 Uploaded jbrayet parents: diff changeset	65 #Go to working directory
b21296a98eb2 Uploaded jbrayet parents: diff changeset	66
b21296a98eb2 Uploaded jbrayet parents: diff changeset	67 cd $OUTPUT_PATH
b21296a98eb2 Uploaded jbrayet parents: diff changeset	68
b21296a98eb2 Uploaded jbrayet parents: diff changeset	69 #Create symbolic link to input and annotations
b21296a98eb2 Uploaded jbrayet parents: diff changeset	70
b21296a98eb2 Uploaded jbrayet parents: diff changeset	71 ln -s $INPUT ${OUTPUT_PATH}/rawdata/input.bam
b21296a98eb2 Uploaded jbrayet parents: diff changeset	72
b21296a98eb2 Uploaded jbrayet parents: diff changeset	73 rm annotation
b21296a98eb2 Uploaded jbrayet parents: diff changeset	74
b21296a98eb2 Uploaded jbrayet parents: diff changeset	75 ln -s $annotationPath annotation
b21296a98eb2 Uploaded jbrayet parents: diff changeset	76
b21296a98eb2 Uploaded jbrayet parents: diff changeset	77 #Edit config-ncrna.txt
b21296a98eb2 Uploaded jbrayet parents: diff changeset	78
b21296a98eb2 Uploaded jbrayet parents: diff changeset	79 CONFIG_FILE=config-ncrna.txt
b21296a98eb2 Uploaded jbrayet parents: diff changeset	80
b21296a98eb2 Uploaded jbrayet parents: diff changeset	81 sed -i "s:^BOWTIE_GENOME_REFERENCE =.*$:BOWTIE_GENOME_REFERENCE = $GENOME_2:g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	82 sed -i "s:^ORGANISM.*$:ORGANISM = $GENOME_2:g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	83
b21296a98eb2 Uploaded jbrayet parents: diff changeset	84 sed -i "s:^N_CPU.$:N_CPU = 4:g" $CONFIG_FILE #***** Make sure this value matches universe.ini files
b21296a98eb2 Uploaded jbrayet parents: diff changeset	85 sed -i "s:^PROJECT_NAME =.*$:PROJECT_NAME = $PROJECTNAME:g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	86
b21296a98eb2 Uploaded jbrayet parents: diff changeset	87
b21296a98eb2 Uploaded jbrayet parents: diff changeset	88 #sed -i "s/LOGFILE = pipeline.log/LOGFILE = $LOG_FILE/g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	89
b21296a98eb2 Uploaded jbrayet parents: diff changeset	90 if [[ -f "$annotationPath/$GENOME_2/cluster_pirna.gff" ]]
b21296a98eb2 Uploaded jbrayet parents: diff changeset	91 then
b21296a98eb2 Uploaded jbrayet parents: diff changeset	92 ANNO_CATALOG="$annotationPath/$GENOME_2/precursor_miRNA.gff $annotationPath/$GENOME_2/rfam.gff $annotationPath/$GENOME_2/cluster_pirna.gff $annotationPath/$GENOME_2/rmsk.gff $annotationPath/$GENOME_2/coding_gene.gff"
b21296a98eb2 Uploaded jbrayet parents: diff changeset	93 else
b21296a98eb2 Uploaded jbrayet parents: diff changeset	94 if [[ -f "$annotationPath/$GENOME_2/pirna.gff" ]]
b21296a98eb2 Uploaded jbrayet parents: diff changeset	95 then
b21296a98eb2 Uploaded jbrayet parents: diff changeset	96 ANNO_CATALOG="$annotationPath/$GENOME_2/precursor_miRNA.gff $annotationPath/$GENOME_2/rfam.gff $annotationPath/$GENOME_2/pirna.gff $annotationPath/$GENOME_2/rmsk.gff $annotationPath/$GENOME_2/coding_gene.gff"
b21296a98eb2 Uploaded jbrayet parents: diff changeset	97 else
b21296a98eb2 Uploaded jbrayet parents: diff changeset	98 ANNO_CATALOG="$annotationPath/$GENOME_2/precursor_miRNA.gff $annotationPath/$GENOME_2/rfam.gff $annotationPath/$GENOME_2/rmsk.gff $annotationPath/$GENOME_2/coding_gene.gff"
b21296a98eb2 Uploaded jbrayet parents: diff changeset	99 fi
b21296a98eb2 Uploaded jbrayet parents: diff changeset	100 fi
b21296a98eb2 Uploaded jbrayet parents: diff changeset	101
b21296a98eb2 Uploaded jbrayet parents: diff changeset	102 sed -i "s:^ANNO_CATALOG.*$:ANNO_CATALOG = $ANNO_CATALOG:g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	103
b21296a98eb2 Uploaded jbrayet parents: diff changeset	104 ####### Remove information in config-ncrna.txt file ###############
b21296a98eb2 Uploaded jbrayet parents: diff changeset	105
b21296a98eb2 Uploaded jbrayet parents: diff changeset	106 sed -i "s:^MATURE_MIRNA =.*$:MATURE_MIRNA =:g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	107 sed -i "s:^PRECURSOR_MIRNA =.*$:PRECURSOR_MIRNA =:g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	108 sed -i "s:^TRNA_UCSC =.*$:TRNA_UCSC =:g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	109 sed -i "s:^NCRNA_RFAM =.*$:NCRNA_RFAM =:g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	110 sed -i "s:^NCRNA_RFAM_EX =.*$:NCRNA_RFAM_EX =:g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	111 sed -i "s:^NCRNA_RMSK =.*$:NCRNA_RMSK =:g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	112 sed -i "s:^NCRNA_RMSK_EX =.*$:NCRNA_RMSK_EX =:g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	113 sed -i "s:^OTHER_NCRNA_GFF =.*$:OTHER_NCRNA_GFF =:g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	114
b21296a98eb2 Uploaded jbrayet parents: diff changeset	115 #######################################
b21296a98eb2 Uploaded jbrayet parents: diff changeset	116
b21296a98eb2 Uploaded jbrayet parents: diff changeset	117 if [[ $DATATYPE == "matmir" ]];then
b21296a98eb2 Uploaded jbrayet parents: diff changeset	118
b21296a98eb2 Uploaded jbrayet parents: diff changeset	119 sed -i "s/MATURE_MIRNA =/MATURE_MIRNA = $EXT/g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	120
b21296a98eb2 Uploaded jbrayet parents: diff changeset	121 elif [[ $DATATYPE == "premir" ]];then
b21296a98eb2 Uploaded jbrayet parents: diff changeset	122
b21296a98eb2 Uploaded jbrayet parents: diff changeset	123 sed -i "s/PRECURSOR_MIRNA =/PRECURSOR_MIRNA = $EXT/g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	124
b21296a98eb2 Uploaded jbrayet parents: diff changeset	125 elif [[ $DATATYPE == "trna" ]];then
b21296a98eb2 Uploaded jbrayet parents: diff changeset	126
b21296a98eb2 Uploaded jbrayet parents: diff changeset	127 sed -i "s/TRNA_UCSC =/TRNA_UCSC = $EXT/g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	128
b21296a98eb2 Uploaded jbrayet parents: diff changeset	129 elif [[ $DATATYPE == "rfam" ]];then
b21296a98eb2 Uploaded jbrayet parents: diff changeset	130
b21296a98eb2 Uploaded jbrayet parents: diff changeset	131 sed -i "s/NCRNA_RFAM_EX =/NCRNA_RFAM_EX = $EXT/g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	132
b21296a98eb2 Uploaded jbrayet parents: diff changeset	133 elif [[ $DATATYPE == "rmsk" ]];then
b21296a98eb2 Uploaded jbrayet parents: diff changeset	134
b21296a98eb2 Uploaded jbrayet parents: diff changeset	135 sed -i "s/NCRNA_RMSK_EX =/NCRNA_RMSK_EX = $EXT/g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	136
b21296a98eb2 Uploaded jbrayet parents: diff changeset	137 elif [[ $DATATYPE == "other" ]];then
b21296a98eb2 Uploaded jbrayet parents: diff changeset	138
b21296a98eb2 Uploaded jbrayet parents: diff changeset	139 # get the gff3 file
b21296a98eb2 Uploaded jbrayet parents: diff changeset	140 IFS=',' read -ra gff <<< "$EXT"
b21296a98eb2 Uploaded jbrayet parents: diff changeset	141 echo "${gff[0]}" \| sed 's/\//\\\//g' > gff
b21296a98eb2 Uploaded jbrayet parents: diff changeset	142 gff_file=$(head -n 1 gff)
b21296a98eb2 Uploaded jbrayet parents: diff changeset	143 sed -i "s/OTHER_NCRNA_GFF =/OTHER_NCRNA_GFF = $gff_file/g" $CONFIG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	144
b21296a98eb2 Uploaded jbrayet parents: diff changeset	145 fi
b21296a98eb2 Uploaded jbrayet parents: diff changeset	146
b21296a98eb2 Uploaded jbrayet parents: diff changeset	147 echo "building the command line" >> $DEBUG
b21296a98eb2 Uploaded jbrayet parents: diff changeset	148
b21296a98eb2 Uploaded jbrayet parents: diff changeset	149 #Build command line
b21296a98eb2 Uploaded jbrayet parents: diff changeset	150 ## **************************************************************** NEW : check if reads are grouped and change command line accordingly******
b21296a98eb2 Uploaded jbrayet parents: diff changeset	151
b21296a98eb2 Uploaded jbrayet parents: diff changeset	152 RG=`samtools view $INPUT \| awk --posix 'BEGIN {RG=1} { if ($1 !~ /^[0-9]{1,}_[0-9]{1,}$/) {RG=0 ; exit} } END { print RG}'`
b21296a98eb2 Uploaded jbrayet parents: diff changeset	153
b21296a98eb2 Uploaded jbrayet parents: diff changeset	154 if [[ $RG = 0 ]]; then # if not grouped
b21296a98eb2 Uploaded jbrayet parents: diff changeset	155
b21296a98eb2 Uploaded jbrayet parents: diff changeset	156 # add -s processBam to do the grouping
b21296a98eb2 Uploaded jbrayet parents: diff changeset	157 COMMAND_LINE="-c $CONFIG_FILE -s processBam -s generateNcgff -s ncrnaProcess"
b21296a98eb2 Uploaded jbrayet parents: diff changeset	158
b21296a98eb2 Uploaded jbrayet parents: diff changeset	159 else
b21296a98eb2 Uploaded jbrayet parents: diff changeset	160
b21296a98eb2 Uploaded jbrayet parents: diff changeset	161 # eliminate [-s processBam] because reads are already grouped + move input.bam
b21296a98eb2 Uploaded jbrayet parents: diff changeset	162 ln -s $INPUT ${OUTPUT_PATH}/bowtie_results/input.bam
b21296a98eb2 Uploaded jbrayet parents: diff changeset	163 COMMAND_LINE="-c $CONFIG_FILE -s generateNcgff -s ncrnaProcess"
b21296a98eb2 Uploaded jbrayet parents: diff changeset	164 fi
b21296a98eb2 Uploaded jbrayet parents: diff changeset	165
b21296a98eb2 Uploaded jbrayet parents: diff changeset	166 echo "cmd : $COMMAND_LINE" >> $DEBUG
b21296a98eb2 Uploaded jbrayet parents: diff changeset	167 # ************** END NEW *****************************************************************************************************************************
b21296a98eb2 Uploaded jbrayet parents: diff changeset	168
b21296a98eb2 Uploaded jbrayet parents: diff changeset	169 #Launch ncPRO analysis
b21296a98eb2 Uploaded jbrayet parents: diff changeset	170 echo $COMMAND_LINE >> $DEBUG
b21296a98eb2 Uploaded jbrayet parents: diff changeset	171 /usr/curie_ngs/ncproseq_v1.6.5/bin/ncPRO-seq $COMMAND_LINE >> $DEBUG 2>&1
b21296a98eb2 Uploaded jbrayet parents: diff changeset	172
b21296a98eb2 Uploaded jbrayet parents: diff changeset	173 #Galaxy output handling
b21296a98eb2 Uploaded jbrayet parents: diff changeset	174
b21296a98eb2 Uploaded jbrayet parents: diff changeset	175 mv ${OUTPUT_PATH}/pipeline.log $LOG_FILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	176
b21296a98eb2 Uploaded jbrayet parents: diff changeset	177
b21296a98eb2 Uploaded jbrayet parents: diff changeset	178 # PROFILE
b21296a98eb2 Uploaded jbrayet parents: diff changeset	179
b21296a98eb2 Uploaded jbrayet parents: diff changeset	180 if [ -f ${OUTPUT_PATH}/pic/input_*_${EXT}_abundant.png ] ; then
b21296a98eb2 Uploaded jbrayet parents: diff changeset	181 convert -resize 60% ${OUTPUT_PATH}/pic/input_*_${EXT}_abundant.png $OUT_AB
b21296a98eb2 Uploaded jbrayet parents: diff changeset	182 else
b21296a98eb2 Uploaded jbrayet parents: diff changeset	183 echo -e "Distribution of positional read coverage and the read length distribution are unavailable in this annotation family. Check the coverage profile table :\n" > $OUT_AB
b21296a98eb2 Uploaded jbrayet parents: diff changeset	184 cat ${OUTPUT_PATH}/doc/${DATATYPE}_${EXT}_all_samples_scaled_basecov_abundant_all_RPM.data >> $OUT_AB
b21296a98eb2 Uploaded jbrayet parents: diff changeset	185 fi
b21296a98eb2 Uploaded jbrayet parents: diff changeset	186
b21296a98eb2 Uploaded jbrayet parents: diff changeset	187 if [ -f ${OUTPUT_PATH}/pic/input_*_${EXT}_distinct.png ]; then
b21296a98eb2 Uploaded jbrayet parents: diff changeset	188 convert -resize 60% ${OUTPUT_PATH}/pic/input_*_${EXT}_distinct.png $OUT_DIS
b21296a98eb2 Uploaded jbrayet parents: diff changeset	189 else
b21296a98eb2 Uploaded jbrayet parents: diff changeset	190 echo "Distribution of positional read coverage and the read length distribution are unavailable in this annotation family. Check the coverage profile table :\n" > $OUT_DIS
b21296a98eb2 Uploaded jbrayet parents: diff changeset	191 cat ${OUTPUT_PATH}/doc/${DATATYPE}_${EXT}_all_samples_scaled_basecov_distinct_all_RPM.data >> $OUT_DIS
b21296a98eb2 Uploaded jbrayet parents: diff changeset	192
b21296a98eb2 Uploaded jbrayet parents: diff changeset	193 fi
b21296a98eb2 Uploaded jbrayet parents: diff changeset	194
b21296a98eb2 Uploaded jbrayet parents: diff changeset	195 rm -rf $OUTPUT_PATH
b21296a98eb2 Uploaded jbrayet parents: diff changeset	196

Mercurial > repos > jbrayet > ncproseq_1_6_5_docker

annotate ncPRO-PROFILING.sh @ 13:8a50d975ad4d draft default tip