mayatool3_test3: mayachemtools/bin/ExtractFromPDBFiles.pl annotate

annotate mayachemtools/bin/ExtractFromPDBFiles.pl @ 9:ab29fa5c8c1f draft default tip

Uploaded

author	deepakjadmin
date	Thu, 15 Dec 2016 14:18:03 -0500
parents	73ae111cf86f
children

rev	line source
0 73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1 #!/usr/bin/perl -w
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	2 #
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	3 # $RCSfile: ExtractFromPDBFiles.pl,v $
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	4 # $Date: 2015/02/28 20:46:19 $
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	5 # $Revision: 1.39 $
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	6 #
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	7 # Author: Manish Sud <msud@san.rr.com>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	8 #
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	9 # Copyright (C) 2015 Manish Sud. All rights reserved.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	10 #
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	11 # This file is part of MayaChemTools.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	12 #
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	13 # MayaChemTools is free software; you can redistribute it and/or modify it under
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	14 # the terms of the GNU Lesser General Public License as published by the Free
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	15 # Software Foundation; either version 3 of the License, or (at your option) any
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	16 # later version.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	17 #
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	18 # MayaChemTools is distributed in the hope that it will be useful, but without
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	19 # any warranty; without even the implied warranty of merchantability of fitness
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	20 # for a particular purpose. See the GNU Lesser General Public License for more
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	21 # details.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	22 #
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	23 # You should have received a copy of the GNU Lesser General Public License
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	24 # along with MayaChemTools; if not, see <http://www.gnu.org/licenses/> or
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	25 # write to the Free Software Foundation Inc., 59 Temple Place, Suite 330,
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	26 # Boston, MA, 02111-1307, USA.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	27 #
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	28
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	29 use strict;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	30 use FindBin; use lib "$FindBin::Bin/../lib";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	31 use Getopt::Long;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	32 use File::Basename;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	33 use Text::ParseWords;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	34 use Benchmark;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	35 use FileUtil;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	36 use TextUtil;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	37 use PDBFileUtil;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	38 use AminoAcids;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	39 use SequenceFileUtil;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	40
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	41 my($ScriptName, %Options, $StartTime, $EndTime, $TotalTime);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	42
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	43 # Autoflush STDOUT
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	44 $\| = 1;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	45
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	46 # Starting message...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	47 $ScriptName = basename($0);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	48 print "\n$ScriptName: Starting...\n\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	49 $StartTime = new Benchmark;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	50
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	51 # Get the options and setup script...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	52 SetupScriptUsage();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	53 if ($Options{help} \|\| @ARGV < 1) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	54 die GetUsageFromPod("$FindBin::Bin/$ScriptName");
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	55 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	56
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	57 my(@PDBFilesList);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	58 @PDBFilesList = ExpandFileNames(\@ARGV, "pdb");
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	59
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	60 # Process options...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	61 print "Processing options...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	62 my(%OptionsInfo);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	63 ProcessOptions();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	64
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	65 # Setup information about input files...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	66 print "Checking input PDB file(s)...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	67 my(%PDBFilesInfo);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	68 RetrievePDBFilesInfo();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	69
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	70 # Process input files..
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	71 my($FileIndex);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	72 if (@PDBFilesList > 1) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	73 print "\nProcessing PDB files...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	74 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	75 for $FileIndex (0 .. $#PDBFilesList) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	76 if ($PDBFilesInfo{FileOkay}[$FileIndex]) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	77 print "\nProcessing file $PDBFilesList[$FileIndex]...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	78 ExtractFromPDBFiles($FileIndex);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	79 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	80 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	81 print "\n$ScriptName:Done...\n\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	82
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	83 $EndTime = new Benchmark;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	84 $TotalTime = timediff ($EndTime, $StartTime);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	85 print "Total time: ", timestr($TotalTime), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	86
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	87 ###############################################################################
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	88
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	89 # Extract appropriate information...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	90 sub ExtractFromPDBFiles {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	91 my($FileIndex) = @_;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	92 my($PDBFile, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	93
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	94 # Get PDB data...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	95 $PDBFile = $PDBFilesList[$FileIndex];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	96 $PDBRecordLinesRef = ReadPDBFile($PDBFile);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	97
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	98 if ($OptionsInfo{Mode} =~ /Chains/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	99 ExtractChains($FileIndex, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	100 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	101 elsif ($OptionsInfo{Mode} =~ /Sequences/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	102 ExtractSequences($FileIndex, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	103 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	104 elsif ($OptionsInfo{Mode} =~ /^(Atoms\|CAlphas\|AtomNums\|AtomsRange\|AtomNames)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	105 ExtractByAtoms($FileIndex, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	106 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	107 elsif ($OptionsInfo{Mode} =~ /^(ResidueNums\|ResiduesRange\|ResidueNames)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	108 ExtractByResidues($FileIndex, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	109 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	110 elsif ($OptionsInfo{Mode} =~ /Distance/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	111 ExtractByDistance($FileIndex, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	112 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	113 elsif ($OptionsInfo{Mode} =~ /NonWater/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	114 ExtractNonWaterRecords($FileIndex, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	115 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	116 elsif ($OptionsInfo{Mode} =~ /NonHydrogens/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	117 ExtractNonHydrogenRecords($FileIndex, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	118 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	119 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	120
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	121 # Extract chains and generate new PDB files...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	122 #
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	123 sub ExtractChains {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	124 my($FileIndex, $PDBRecordLinesRef) = @_;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	125 my($ChainIndex, $ChainID, $ChainLabel, $PDBFileName, $RecordLine, $ChainsAndResiduesInfoRef, $AtomNumber, $AtomName, $ResidueName, $AtomChainID, $ResidueNumber, $AlternateLocation, $InsertionCode, $ConectRecordLinesRef, %ChainAtomNumbersMap);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	126
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	127 # Get chains and residues data...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	128 $ChainsAndResiduesInfoRef = GetChainsAndResidues($PDBRecordLinesRef, 'AtomAndHetatm', 0, 1);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	129
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	130 if ($OptionsInfo{CombineChains}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	131 $PDBFileName = $PDBFilesInfo{OutFileNames}[$FileIndex][0];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	132 print "Generating PDBFileName file $PDBFileName...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	133
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	134 open OUTFILE, ">$PDBFileName" or die "Error: Can't open $PDBFileName: $! \n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	135
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	136 # Write out header and other older recors...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	137 WriteHeaderAndOlderRecords(\*OUTFILE, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	138 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	139
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	140 for $ChainIndex (0 .. $#{$PDBFilesInfo{SpecifiedChains}[$FileIndex]}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	141 $ChainID = $PDBFilesInfo{SpecifiedChains}[$FileIndex][$ChainIndex];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	142 $ChainLabel = $PDBFilesInfo{ChainLabels}[$FileIndex][$ChainIndex];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	143
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	144 if (!$OptionsInfo{CombineChains}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	145 $PDBFileName = $PDBFilesInfo{OutFileNames}[$FileIndex][$ChainIndex];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	146 print "Generating PDBFileName file $PDBFileName...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	147
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	148 open OUTFILE, ">$PDBFileName" or die "Error: Can't open $PDBFileName: $! \n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	149
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	150 # Write out header and other older recors...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	151 WriteHeaderAndOlderRecords(\*OUTFILE, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	152 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	153
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	154 # Write out ATOM/HETATM line for chain and collect all ATOM/HETATM serial numbers
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	155 # for writing out appropriate CONECT records...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	156 %ChainAtomNumbersMap = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	157 for $RecordLine (@{$ChainsAndResiduesInfoRef->{Lines}{$ChainID}}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	158 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	159 ($AtomNumber, $AtomName, $AlternateLocation, $ResidueName, $AtomChainID, $ResidueNumber, $InsertionCode) = ParseAtomRecordLine($RecordLine);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	160 $AtomNumber = int $AtomNumber;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	161 $ChainAtomNumbersMap{$AtomNumber} = $AtomName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	162 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	163 # Write out TER record using information from last chain record...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	164 $AtomNumber += 1;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	165 print OUTFILE GenerateTerRecordLine($AtomNumber, $ResidueName, $AtomChainID, $ResidueNumber, $InsertionCode), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	166
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	167 # Write out CONECT records...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	168 $ConectRecordLinesRef = GetConectRecordLines($PDBRecordLinesRef, \%ChainAtomNumbersMap);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	169
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	170 for $RecordLine (@{$ConectRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	171 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	172 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	173
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	174 if (!$OptionsInfo{CombineChains}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	175 # Write out END record...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	176 print OUTFILE GenerateEndRecordLine(), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	177
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	178 close OUTFILE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	179 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	180 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	181
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	182 if ($OptionsInfo{CombineChains}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	183 # Write out END record...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	184 print OUTFILE GenerateEndRecordLine(), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	185
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	186 close OUTFILE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	187 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	188
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	189 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	190
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	191 # Extract sequences for individual chains or combine all the chains...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	192 sub ExtractSequences {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	193 my($FileIndex, $PDBRecordLinesRef) = @_;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	194 my($ChainIndex, $ChainID, $ChainLabel, $SequenceFileName, $Residue, $ResidueCode, $StandardResidue, $ChainSequence, $WrappedChainSequence, $ChainSequenceID, $ChainsAndResiduesInfoRef, $ChainResiduesRef, %ChainSequencesDataMap);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	195
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	196 if ($OptionsInfo{SequenceRecordSource} =~ /^SeqRes$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	197 $ChainsAndResiduesInfoRef = GetChainsAndResidues($PDBRecordLinesRef, 'SeqRes');
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	198 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	199 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	200 $ChainsAndResiduesInfoRef = GetChainsAndResidues($PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	201 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	202
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	203 # Generate sequence data for all the chains...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	204 %ChainSequencesDataMap = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	205 @{$ChainSequencesDataMap{IDs}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	206 %{$ChainSequencesDataMap{Sequence}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	207 %{$ChainSequencesDataMap{Description}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	208
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	209 for $ChainIndex (0 .. $#{$PDBFilesInfo{SpecifiedChains}[$FileIndex]}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	210 $ChainID = $PDBFilesInfo{SpecifiedChains}[$FileIndex][$ChainIndex];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	211 $ChainLabel = $PDBFilesInfo{ChainLabels}[$FileIndex][$ChainIndex];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	212
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	213 # Setup sequence ID...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	214 $ChainSequenceID = $PDBFilesInfo{ChainSequenceIDs}[$FileIndex][$ChainIndex];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	215 push @{$ChainSequencesDataMap{IDs}}, $ChainSequenceID;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	216 $ChainSequencesDataMap{Description}{$ChainID} = $ChainSequenceID;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	217
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	218 # Collect sequence data for the chain...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	219 if ($OptionsInfo{SequenceRecordSource} =~ /^SeqRes/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	220 $ChainResiduesRef = \@{$ChainsAndResiduesInfoRef->{Residues}{$ChainID}};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	221 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	222 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	223 $ChainResiduesRef = \@{$ChainsAndResiduesInfoRef->{Residues}{$ChainID}};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	224 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	225 # Setup sequence data...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	226 $ChainSequence = '';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	227 RESIDUE: for $Residue (@{$ChainResiduesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	228 ($ResidueCode, $StandardResidue) = GetResidueCode($Residue);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	229 if (!$StandardResidue) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	230 if ($OptionsInfo{KeepNonStandardSequences}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	231 $ResidueCode = $OptionsInfo{NonStandardSequenceCode};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	232 warn "Warning: Keeping nonstandard residue $Residue in $ChainLabel...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	233 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	234 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	235 warn "Warning: Ignoring nonstandard residue $Residue in $ChainLabel...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	236 next RESIDUE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	237 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	238 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	239 $ChainSequence .= $ResidueCode;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	240 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	241 $ChainSequencesDataMap{Sequence}{$ChainID} = $ChainSequence;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	242
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	243 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	244
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	245 # Write out the sequence files...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	246 my($SequenceID, $SequenceDescription, $Sequence, %SequencesDataMap );
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	247 if ($OptionsInfo{CombineChainSequences}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	248 # Combine all the chain sequences...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	249 $Sequence = '';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	250 for $ChainIndex (0 .. $#{$PDBFilesInfo{SpecifiedChains}[$FileIndex]}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	251 $ChainID = $PDBFilesInfo{SpecifiedChains}[$FileIndex][$ChainIndex];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	252
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	253 $Sequence .= $ChainSequencesDataMap{Sequence}{$ChainID};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	254 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	255 $SequenceID = $PDBFilesInfo{ChainSequenceIDsPrefix}[$FileIndex][0] . "_CombinedChains\|PDB";;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	256 $SequenceDescription = $SequenceID;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	257 $SequenceFileName = $PDBFilesInfo{OutFileNames}[$FileIndex][0];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	258
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	259 print "Generating sequence file $SequenceFileName...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	260 %SequencesDataMap = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	261 @{$SequencesDataMap{IDs}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	262 %{$SequencesDataMap{Sequence}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	263 %{$SequencesDataMap{Description}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	264
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	265 push @{$SequencesDataMap{IDs}}, $SequenceID;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	266 $SequencesDataMap{Description}{$SequenceID} = $SequenceDescription;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	267 $SequencesDataMap{Sequence}{$SequenceID} = $Sequence;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	268
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	269 WritePearsonFastaSequenceFile($SequenceFileName, \%SequencesDataMap, $OptionsInfo{MaxSequenceLength});
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	270 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	271 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	272 # For each specifed chain, write out the sequences...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	273 for $ChainIndex (0 .. $#{$PDBFilesInfo{SpecifiedChains}[$FileIndex]}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	274 $ChainID = $PDBFilesInfo{SpecifiedChains}[$FileIndex][$ChainIndex];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	275
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	276 $SequenceFileName = $PDBFilesInfo{OutFileNames}[$FileIndex][$ChainIndex];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	277
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	278 $SequenceID = $ChainSequencesDataMap{IDs}[$ChainIndex];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	279 $SequenceDescription = $ChainSequencesDataMap{Description}{$ChainID};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	280 $Sequence = $ChainSequencesDataMap{Sequence}{$ChainID};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	281
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	282 print "Generating sequence file $SequenceFileName...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	283 %SequencesDataMap = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	284 @{$SequencesDataMap{IDs}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	285 %{$SequencesDataMap{Sequence}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	286 %{$SequencesDataMap{Description}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	287
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	288 push @{$SequencesDataMap{IDs}}, $SequenceID;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	289 $SequencesDataMap{Description}{$SequenceID} = $SequenceDescription;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	290 $SequencesDataMap{Sequence}{$SequenceID} = $Sequence;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	291
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	292 WritePearsonFastaSequenceFile($SequenceFileName, \%SequencesDataMap, $OptionsInfo{MaxSequenceLength});
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	293 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	294 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	295 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	296
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	297 # Extract atoms...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	298 sub ExtractByAtoms {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	299 my($FileIndex, $PDBRecordLinesRef) = @_;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	300 my($PDBFileName, $RecordLine, $ChainRecordCount, $AtomNumber, $AtomName, $IgnoreRecord, $ConectRecordLinesRef, %AtomNumbersMap);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	301
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	302 $PDBFileName = $PDBFilesInfo{OutFileNames}[$FileIndex][0];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	303 print "Generating PDBFileName file $PDBFileName...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	304 open OUTFILE, ">$PDBFileName" or die "Error: Can't open $PDBFileName: $! \n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	305
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	306 # Write out header and other older recors...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	307 WriteHeaderAndOlderRecords(\*OUTFILE, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	308
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	309 # Write out all ATOM records along with TER and model records to indicate
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	310 # chains and multiple models..
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	311 %AtomNumbersMap = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	312 $ChainRecordCount = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	313 for $RecordLine (@{$PDBRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	314 if (CheckRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	315 ($AtomNumber, $AtomName) = ParseAtomRecordLine($RecordLine);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	316
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	317 # Check atoms...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	318 $IgnoreRecord = 1;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	319 if ($OptionsInfo{Mode} =~ /^Atoms$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	320 $IgnoreRecord = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	321 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	322 elsif ($OptionsInfo{Mode} =~ /^(CAlphas\|AtomNames)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	323 if (exists $OptionsInfo{SpecifiedAtomNamesMap}{lc $AtomName}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	324 $IgnoreRecord = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	325 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	326 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	327 elsif ($OptionsInfo{Mode} =~ /^AtomNums$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	328 if (exists $OptionsInfo{SpecifiedAtomNumsMap}{$AtomNumber}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	329 $IgnoreRecord = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	330 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	331 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	332 elsif ($OptionsInfo{Mode} =~ /^AtomsRange$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	333 if ($AtomNumber >= $OptionsInfo{SpecifiedStartAtomNum} && $AtomNumber <= $OptionsInfo{SpecifiedEndAtomNum}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	334 $IgnoreRecord = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	335 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	336 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	337
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	338 if (!$IgnoreRecord) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	339 $ChainRecordCount++;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	340 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	341
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	342 $AtomNumber = int $AtomNumber;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	343 $AtomNumbersMap{$AtomNumber} = $AtomName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	344 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	345 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	346 elsif (IsTerRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	347 if ($ChainRecordCount) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	348 print OUTFILE GenerateTerRecordLine(), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	349 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	350 $ChainRecordCount = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	351 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	352 elsif (IsModelRecordType($RecordLine) \|\| IsEndmdlRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	353 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	354 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	355 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	356
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	357 # Write out appropriate CONECT records...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	358 $ConectRecordLinesRef = GetConectRecordLines($PDBRecordLinesRef, \%AtomNumbersMap);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	359 for $RecordLine (@{$ConectRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	360 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	361 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	362
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	363 # Write out END record...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	364 print OUTFILE GenerateEndRecordLine(), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	365
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	366 close OUTFILE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	367 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	368
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	369 # Extract residues...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	370 sub ExtractByResidues {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	371 my($FileIndex, $PDBRecordLinesRef) = @_;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	372 my($PDBFileName, $RecordLine, $ChainRecordCount, $AtomNumber, $AtomName, $AlternateLocation, $ResidueName, $ChainID, $ResidueNumber, $ConectRecordLinesRef, $IgnoreRecord, %AtomNumbersMap);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	373
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	374 $PDBFileName = $PDBFilesInfo{OutFileNames}[$FileIndex][0];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	375 print "Generating PDBFileName file $PDBFileName...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	376 open OUTFILE, ">$PDBFileName" or die "Error: Can't open $PDBFileName: $! \n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	377
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	378 # Write out header and other older recors...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	379 WriteHeaderAndOlderRecords(\*OUTFILE, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	380
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	381 # Write out all ATOM records for specified residues with TER and model records to indicate
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	382 # chains and multiple models...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	383 %AtomNumbersMap = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	384 $ChainRecordCount = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	385 for $RecordLine (@{$PDBRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	386 if (CheckRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	387 ($AtomNumber, $AtomName, $AlternateLocation, $ResidueName, $ChainID, $ResidueNumber) = ParseAtomRecordLine($RecordLine);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	388
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	389 # Check residues...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	390 $IgnoreRecord = 1;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	391 if ($OptionsInfo{Mode} =~ /^ResidueNums$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	392 if (exists $OptionsInfo{SpecifiedResidueNumsMap}{$ResidueNumber}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	393 $IgnoreRecord = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	394 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	395 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	396 elsif ($OptionsInfo{Mode} =~ /^ResiduesRange$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	397 if ($ResidueNumber >= $OptionsInfo{SpecifiedStartResidueNum} && $ResidueNumber <= $OptionsInfo{SpecifiedEndResidueNum}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	398 $IgnoreRecord = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	399 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	400 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	401 elsif ($OptionsInfo{Mode} =~ /^ResidueNames$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	402 if (exists $OptionsInfo{SpecifiedResidueNamesMap}{lc $ResidueName}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	403 $IgnoreRecord = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	404 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	405 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	406 if (!$IgnoreRecord) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	407 $ChainRecordCount++;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	408 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	409 $AtomNumber = int $AtomNumber;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	410 $AtomNumbersMap{$AtomNumber} = $AtomName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	411 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	412 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	413 elsif (IsTerRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	414 if ($ChainRecordCount) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	415 print OUTFILE GenerateTerRecordLine(), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	416 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	417 $ChainRecordCount = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	418 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	419 elsif (IsModelRecordType($RecordLine) \|\| IsEndmdlRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	420 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	421 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	422 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	423
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	424 # Write out appropriate CONECT records...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	425 $ConectRecordLinesRef = GetConectRecordLines($PDBRecordLinesRef, \%AtomNumbersMap);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	426 for $RecordLine (@{$ConectRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	427 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	428 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	429 # Write out END record...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	430 print OUTFILE GenerateEndRecordLine(), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	431
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	432 close OUTFILE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	433 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	434
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	435 # Extract non water records...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	436 sub ExtractNonWaterRecords {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	437 my($FileIndex, $PDBRecordLinesRef) = @_;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	438 my($PDBFileName, $RecordLine, $ChainRecordCount, $AtomNumber, $AtomName, $AlternateLocation, $ResidueName, $ConectRecordLinesRef, %AtomNumbersMap);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	439
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	440 $PDBFileName = $PDBFilesInfo{OutFileNames}[$FileIndex][0];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	441 print "Generating PDBFileName file $PDBFileName...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	442 open OUTFILE, ">$PDBFileName" or die "Error: Can't open $PDBFileName: $! \n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	443
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	444 # Write out header and other older recors...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	445 WriteHeaderAndOlderRecords(\*OUTFILE, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	446
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	447 # Write out all ATOM/HETATM non water records along with TER and model records to indicate
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	448 # chains and multiple models..
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	449 %AtomNumbersMap = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	450 $ChainRecordCount = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	451 for $RecordLine (@{$PDBRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	452 if (CheckRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	453 ($AtomNumber, $AtomName, $AlternateLocation, $ResidueName) = ParseAtomRecordLine($RecordLine);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	454 if (! exists $OptionsInfo{SpecifiedWaterResiduesMap}{$ResidueName} ) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	455 $ChainRecordCount++;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	456 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	457 $AtomNumber = int $AtomNumber;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	458 $AtomNumbersMap{$AtomNumber} = $AtomName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	459 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	460 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	461 elsif (IsTerRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	462 if ($ChainRecordCount) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	463 print OUTFILE GenerateTerRecordLine(), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	464 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	465 $ChainRecordCount = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	466 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	467 elsif (IsModelRecordType($RecordLine) \|\| IsEndmdlRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	468 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	469 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	470 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	471
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	472 # Write out appropriate CONECT records...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	473 $ConectRecordLinesRef = GetConectRecordLines($PDBRecordLinesRef, \%AtomNumbersMap);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	474 for $RecordLine (@{$ConectRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	475 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	476 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	477 # Write out END record...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	478 print OUTFILE GenerateEndRecordLine(), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	479
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	480 close OUTFILE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	481 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	482
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	483 # Extract non hydrogen records...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	484 sub ExtractNonHydrogenRecords {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	485 my($FileIndex, $PDBRecordLinesRef) = @_;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	486 my($PDBFileName, $RecordLine, $ChainRecordCount, $AtomNumber, $AtomName, $AlternateLocation, $ResidueName, $ChainID, $ResidueNumber, $InsertionCode, $X, $Y, $Z, $Occupancy, $TemperatureFactor, $SegmentID, $ElementSymbol, $AtomCharge, $ConectRecordLinesRef, %AtomNumbersMap);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	487
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	488 $PDBFileName = $PDBFilesInfo{OutFileNames}[$FileIndex][0];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	489 print "Generating PDBFileName file $PDBFileName...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	490 open OUTFILE, ">$PDBFileName" or die "Error: Can't open $PDBFileName: $! \n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	491
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	492 # Write out header and other older recors...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	493 WriteHeaderAndOlderRecords(\*OUTFILE, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	494
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	495 # Write out all ATOM/HETATM non hydrogen records along with TER and model records to indicate
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	496 # chains and multiple models..
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	497 %AtomNumbersMap = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	498 $ChainRecordCount = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	499 for $RecordLine (@{$PDBRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	500 if (CheckRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	501 ($AtomNumber, $AtomName, $AlternateLocation, $ResidueName, $ChainID, $ResidueNumber, $InsertionCode, $X, $Y, $Z, $Occupancy, $TemperatureFactor, $SegmentID, $ElementSymbol, $AtomCharge) = ParseAtomRecordLine($RecordLine);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	502 if ($ElementSymbol !~ /^H$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	503 $ChainRecordCount++;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	504 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	505 $AtomNumber = int $AtomNumber;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	506 $AtomNumbersMap{$AtomNumber} = $AtomName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	507 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	508 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	509 elsif (IsTerRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	510 if ($ChainRecordCount) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	511 print OUTFILE GenerateTerRecordLine(), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	512 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	513 $ChainRecordCount = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	514 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	515 elsif (IsModelRecordType($RecordLine) \|\| IsEndmdlRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	516 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	517 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	518 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	519
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	520 # Write out appropriate CONECT records...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	521 $ConectRecordLinesRef = GetConectRecordLines($PDBRecordLinesRef, \%AtomNumbersMap);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	522 for $RecordLine (@{$ConectRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	523 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	524 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	525 # Write out END record...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	526 print OUTFILE GenerateEndRecordLine(), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	527
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	528 close OUTFILE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	529 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	530
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	531 # Extract ATOM/HETATM records by distance...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	532 sub ExtractByDistance {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	533 my($FileIndex, $PDBRecordLinesRef) = @_;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	534 my($PDBFileName, $RecordLine, $RecordLineNum, $ChainRecordCount, $ConectRecordLinesRef, $AtomNumber, $AtomName, $AlternateLocation, $ResidueName, $ChainID, $ResidueNumber, $InsertionCode, $X, $Y, $Z, $IgnoreRecord, $ResidueID, @OriginCoords, @Coords, %AtomNumbersMap, %ResiduesDataMap);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	535
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	536 $PDBFileName = $PDBFilesInfo{OutFileNames}[$FileIndex][0];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	537 print "Generating PDBFileName file $PDBFileName...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	538 open OUTFILE, ">$PDBFileName" or die "Error: Can't open $PDBFileName: $! \n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	539
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	540 # Write out header and other older recors...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	541 WriteHeaderAndOlderRecords(\*OUTFILE, $PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	542
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	543 # Setup coordinates of origin to calculate distance...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	544 @OriginCoords = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	545 push @OriginCoords, @{$PDBFilesInfo{DistanceOrigin}[$FileIndex]};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	546
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	547 # Write out all ATOM records for which meet specified criteria along with TER and model records to indicate
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	548 # chains and multiple models...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	549 %AtomNumbersMap = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	550
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	551 %ResiduesDataMap = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	552 %{$ResiduesDataMap{ID}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	553 %{$ResiduesDataMap{Status}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	554
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	555 $ChainRecordCount = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	556 $RecordLineNum = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	557
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	558 for $RecordLine (@{$PDBRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	559 $RecordLineNum++;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	560 if (CheckRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	561 ($AtomNumber, $AtomName, $AlternateLocation, $ResidueName, $ChainID, $ResidueNumber, $InsertionCode, $X, $Y, $Z) = ParseAtomRecordLine($RecordLine);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	562 @Coords = (); push @Coords, ($X, $Y, $Z);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	563
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	564 $IgnoreRecord = 1;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	565 if ($OptionsInfo{DistanceSelectionMode} =~ /^ByResidue$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	566 $ResidueID = "${ResidueName}_${ResidueNumber}_${ChainID}";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	567 if (exists $ResiduesDataMap{ID}{$ResidueID}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	568 # Residue data has been processed; check its selection status...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	569 if ($ResiduesDataMap{Status}{$ResidueID}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	570 $IgnoreRecord = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	571 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	572 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	573 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	574 # Residue hasn't been processed...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	575 $ResiduesDataMap{ID}{$ResidueID} = $ResidueID;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	576 $ResiduesDataMap{Status}{$ResidueID} = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	577 if (CheckResidueDistance($ResidueID, $RecordLineNum, $PDBRecordLinesRef, \@OriginCoords)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	578 $IgnoreRecord = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	579 $ResiduesDataMap{Status}{$ResidueID} = 1;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	580 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	581 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	582 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	583 elsif ($OptionsInfo{DistanceSelectionMode} =~ /^ByAtom$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	584 if (CheckDistance(\@Coords, \@OriginCoords)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	585 $IgnoreRecord = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	586 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	587 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	588
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	589 if (!$IgnoreRecord) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	590 $ChainRecordCount++;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	591 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	592 $AtomNumber = int $AtomNumber;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	593 $AtomNumbersMap{$AtomNumber} = $AtomName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	594 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	595 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	596 elsif (IsTerRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	597 if ($ChainRecordCount) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	598 print OUTFILE GenerateTerRecordLine(), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	599 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	600 $ChainRecordCount = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	601 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	602 elsif (IsModelRecordType($RecordLine) \|\| IsEndmdlRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	603 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	604 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	605 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	606
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	607 # Write out appropriate CONECT records...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	608 $ConectRecordLinesRef = GetConectRecordLines($PDBRecordLinesRef, \%AtomNumbersMap);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	609 for $RecordLine (@{$ConectRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	610 print OUTFILE "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	611 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	612
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	613 # Write out END record...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	614 print OUTFILE GenerateEndRecordLine(), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	615
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	616 close OUTFILE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	617 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	618
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	619 # Does record type correspond to the specified record type?
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	620 sub CheckRecordType {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	621 my($RecordLine) = @_;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	622 my($Status);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	623
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	624 $Status = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	625 if ($OptionsInfo{RecordMode} =~ /^Atom$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	626 $Status = IsAtomRecordType($RecordLine) ? 1 : 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	627 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	628 elsif ($OptionsInfo{RecordMode} =~ /^Hetatm$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	629 $Status = IsHetatmRecordType($RecordLine) ? 1 : 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	630 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	631 elsif ($OptionsInfo{RecordMode} =~ /^AtomAndHetatm$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	632 $Status = (IsAtomRecordType($RecordLine) \|\| IsHetatmRecordType($RecordLine)) ? 1 : 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	633 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	634
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	635 return $Status;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	636 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	637
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	638 # Does record meets distance citerion specified by the user?
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	639 sub CheckResidueDistance {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	640 my($SpecifiedResidueID, $StartingLineNum, $PDBRecordLinesRef, $OriginCoordsRef) = @_;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	641 my($Status, $RecordLine, $RecordLineIndex, $AtomNumber, $AtomName, $AlternateLocation, $ResidueName, $ChainID, $ResidueNumber, $InsertionCode, $X, $Y, $Z, $ResidueID, @Coords);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	642
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	643 $Status = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	644
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	645 RECORDLINE: for $RecordLineIndex (($StartingLineNum - 1) .. $#{$PDBRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	646 $RecordLine = $PDBRecordLinesRef->[$RecordLineIndex];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	647 if (!CheckRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	648 next RECORDLINE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	649 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	650 ($AtomNumber, $AtomName, $AlternateLocation, $ResidueName, $ChainID, $ResidueNumber, $InsertionCode, $X, $Y, $Z) = ParseAtomRecordLine($RecordLine);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	651 $ResidueID = "${ResidueName}_${ResidueNumber}_${ChainID}";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	652
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	653 if ($ResidueID !~ /^$SpecifiedResidueID$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	654 # It's a new residue line...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	655 last RECORDLINE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	656 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	657
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	658 # Check distance...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	659 @Coords = (); push @Coords, ($X, $Y, $Z);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	660 if (CheckDistance(\@Coords, $OriginCoordsRef)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	661 # Distance criterion is met for at least one record in the residue...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	662 $Status = 1;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	663 last RECORDLINE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	664 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	665 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	666 return $Status;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	667 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	668
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	669 # Does record meets distance citerion specified by the user?
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	670 sub CheckDistance {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	671 my($CoordsRef, $OriginCoordsRef) = @_;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	672 my($Status, $Index, $Distance, $DistanceSquare);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	673
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	674 $Status = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	675
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	676 if ($OptionsInfo{ExtractionDistanceMode} =~ /^Residue$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	677 # Go over coordinates of all the atoms in the residue...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	678 my($ResidueCoordsCount) = scalar @{$OriginCoordsRef};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	679 INDEX: for ($Index = 0; $Index < $ResidueCoordsCount; $Index += 3) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	680 $DistanceSquare = ($CoordsRef->[0] - $OriginCoordsRef->[$Index])2 + ($CoordsRef->[1] - $OriginCoordsRef->[$Index + 1])2 + ($CoordsRef->[2] - $OriginCoordsRef->[$Index + 2])**2;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	681 $Distance = sqrt $DistanceSquare;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	682 if ($Distance <= $OptionsInfo{MaxExtractionDistance}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	683 $Status = 1;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	684 last INDEX;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	685 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	686 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	687 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	688 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	689 $DistanceSquare = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	690 for $Index (0 .. 2) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	691 $DistanceSquare += ($CoordsRef->[$Index] - $OriginCoordsRef->[$Index])**2;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	692 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	693 $Distance = sqrt $DistanceSquare;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	694 $Status = ($Distance <= $OptionsInfo{MaxExtractionDistance}) ? 1 : 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	695 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	696
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	697 return $Status;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	698 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	699
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	700 # Write out modifed header and other older records...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	701 sub WriteHeaderAndOlderRecords {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	702 my($OutFileRef, $PDBRecordLinesRef) = @_;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	703
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	704 if ($OptionsInfo{ModifyHeaderRecord}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	705 # Write out modified HEADER record...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	706 my($Classification, $DepositionDate, $IDCode) = GetHeaderRecordInformation($PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	707 $Classification = 'Data extracted using MayaChemTools';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	708 print $OutFileRef GenerateHeaderRecordLine($IDCode, $Classification), "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	709 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	710 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	711 print $OutFileRef $PDBRecordLinesRef->[0], "\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	712 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	713
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	714 # Write out any old records...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	715 if ($OptionsInfo{KeepOldRecords}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	716 my($RecordLineIndex, $RecordLine);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	717 # Skip HEADER record and write out older records all the way upto first MODEL/ATOM/HETATM records from input file...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	718 RECORDLINE: for $RecordLineIndex (1 .. $#{$PDBRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	719 $RecordLine = $PDBRecordLinesRef->[$RecordLineIndex];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	720 if (IsModelRecordType($RecordLine) \|\| IsAtomRecordType($RecordLine) \|\| IsHetatmRecordType($RecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	721 last RECORDLINE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	722 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	723 print $OutFileRef "$RecordLine\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	724 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	725 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	726 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	727
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	728 # Get header record information assuming it's the first record...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	729 sub GetHeaderRecordInformation {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	730 my($PDBRecordLinesRef) = @_;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	731 my($Classification, $DepositionDate, $IDCode, $HeaderRecordLine);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	732
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	733 ($Classification, $DepositionDate, $IDCode) = ('') x 3;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	734 $HeaderRecordLine = $PDBRecordLinesRef->[0];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	735 if (IsHeaderRecordType($HeaderRecordLine)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	736 ($Classification, $DepositionDate, $IDCode) = ParseHeaderRecordLine($HeaderRecordLine);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	737 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	738 return ($Classification, $DepositionDate, $IDCode);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	739 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	740
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	741 # Get one letter residue code...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	742 sub GetResidueCode {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	743 my($ResidueName) = @_;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	744 my($ResidueCode, $StandardResidue);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	745
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	746 $ResidueCode = $OptionsInfo{NonStandardSequenceCode};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	747 $StandardResidue = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	748
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	749 if (length($ResidueName) == 3) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	750 # Assume it's an amino acid...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	751 if (AminoAcids::IsAminoAcid($ResidueName)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	752 # Standard amino acid...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	753 $ResidueCode = AminoAcids::GetAminoAcidOneLetterCode($ResidueName);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	754 $StandardResidue = 1;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	755 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	756 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	757 elsif (length($ResidueName) == 1) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	758 # Assume it's a nucleic acid...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	759 if ($ResidueName =~ /^(A\|G\|T\|U\|C)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	760 $ResidueCode = $ResidueName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	761 $StandardResidue = 1;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	762 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	763 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	764
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	765 return ($ResidueCode, $StandardResidue);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	766 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	767
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	768 # Process option values...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	769 sub ProcessOptions {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	770 %OptionsInfo = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	771 $OptionsInfo{Mode} = $Options{mode};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	772
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	773 my(@SpecifiedChains) = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	774 if ($Options{chains} =~ /^(First\|All)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	775 $OptionsInfo{ChainsToExtract} = $Options{chains};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	776 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	777 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	778 @SpecifiedChains = split /\,/, $Options{chains};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	779 $OptionsInfo{ChainsToExtract} = 'Specified';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	780 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	781 @{$OptionsInfo{SpecifiedChains}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	782 push @{$OptionsInfo{SpecifiedChains}}, @SpecifiedChains;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	783
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	784 $OptionsInfo{CombineChains} = ($Options{combinechains} =~ /^Yes$/i) ? 1 : 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	785
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	786 $OptionsInfo{CombineChainSequences} = ($Options{combinechains} =~ /^Yes$/i) ? 1 : 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	787
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	788 ProcessResiduesOptions();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	789 ProcessAtomsOptions();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	790 ProcessDistanceOptions();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	791
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	792 $OptionsInfo{WaterResidueNames} = $Options{waterresiduenames};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	793 @{$OptionsInfo{SpecifiedWaterResiduesList}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	794 %{$OptionsInfo{SpecifiedWaterResiduesMap}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	795
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	796 my(@SpecifiedWaterResiduesList);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	797 @SpecifiedWaterResiduesList = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	798
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	799 if ($OptionsInfo{Mode} =~ /^NonWater$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	800 my($WaterResidueName);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	801 if ($OptionsInfo{WaterResidueNames} =~ /Automatic/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	802 push @SpecifiedWaterResiduesList, ('HOH', 'WAT', 'H2O');
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	803 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	804 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	805 @SpecifiedWaterResiduesList = split /\,/, $Options{waterresiduenames};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	806 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	807 for $WaterResidueName (@SpecifiedWaterResiduesList) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	808 $OptionsInfo{SpecifiedWaterResiduesMap}{$WaterResidueName} = $WaterResidueName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	809 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	810 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	811 push @{$OptionsInfo{SpecifiedWaterResiduesList}}, @SpecifiedWaterResiduesList;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	812
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	813 $OptionsInfo{RecordMode} = $Options{recordmode} ? $Options{recordmode} : ($Options{mode} =~ /^(Atoms\|CAlphas\|AtomNums\|AtomsRange\|AtomNames)$/i ? "Atom" : "AtomAndHetatm");
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	814
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	815 $OptionsInfo{KeepOldRecords} = ($Options{keepoldrecords} =~ /^Yes$/i) ? 1 : 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	816
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	817 $OptionsInfo{ModifyHeaderRecord} = ($Options{modifyheader} =~ /^Yes$/i) ? 1 : 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	818
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	819 $OptionsInfo{KeepNonStandardSequences} = ($Options{nonstandardkeep} =~ /^Yes$/i) ? 1 : 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	820 $OptionsInfo{NonStandardSequenceCode} = $Options{nonstandardcode};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	821 $OptionsInfo{MaxSequenceLength} = $Options{sequencelength};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	822 $OptionsInfo{SequenceRecordSource} = $Options{sequencerecords};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	823 $OptionsInfo{SequenceIDPrefixSource} = $Options{sequenceidprefix};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	824
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	825 $OptionsInfo{OverwriteFiles} = $Options{overwrite} ? 1 : 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	826 $OptionsInfo{OutFileRoot} = $Options{root} ? $Options{root} : 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	827 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	828
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	829 # Process specified residue options...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	830 sub ProcessResiduesOptions {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	831 my($ResidueNum, $StartResidueNum, $EndResNum, $ResidueName, @SpecifiedResidueNumsList, @SpecifiedResidueNamesList);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	832
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	833 @SpecifiedResidueNumsList = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	834 ($StartResidueNum, $EndResNum) = (0, 0);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	835
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	836 @SpecifiedResidueNamesList = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	837
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	838 if ($OptionsInfo{Mode} =~ /^(ResidueNums\|ResiduesRange\|ResidueNames)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	839 if (!$Options{residues}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	840 die "Error: You must specify a value for \"--Residues\" option in \"ResidueNums, ResiduesRange, or ResidueNames\" \"-m, --mode\". \n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	841 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	842 $OptionsInfo{Residues} = $Options{residues};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	843 $OptionsInfo{Residues} =~ s/ //g;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	844
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	845 if ($OptionsInfo{Mode} =~ /^ResidueNames$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	846 @SpecifiedResidueNamesList = split /\,/, $OptionsInfo{Residues};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	847 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	848 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	849 @SpecifiedResidueNumsList = split /\,/, $OptionsInfo{Residues};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	850 for $ResidueNum (@SpecifiedResidueNumsList) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	851 if (!IsPositiveInteger($ResidueNum)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	852 die "Error: Invalid residue number value, $ResidueNum, for \"--Residues\" option during \"ResidueNumes\" or \"ResiduesRange\"value of \"-m --mode\" option: Residue number must be a positive integer.\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	853 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	854 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	855 if ($OptionsInfo{Mode} =~ /^ResiduesRange$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	856 if (@SpecifiedResidueNumsList != 2) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	857 die "Error: Invalid number of residue number values, ", scalar(@SpecifiedResidueNumsList), ", for \"--Residues\" option during \"ResiduesRange\" value of \"-m --mode\" option: The number of values must be 2 corresponding to start and end residue numbers.\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	858 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	859 if ($SpecifiedResidueNumsList[0] > $SpecifiedResidueNumsList[1]) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	860 die "Error: Invalid residue number values, @SpecifiedResidueNumsList, for \"--Residues\" option during \"ResiduesRange\" value of \"-m --mode\" option: The start residue number must be less than end residue number.\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	861 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	862 ($StartResidueNum, $EndResNum) = @SpecifiedResidueNumsList;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	863 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	864 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	865 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	866
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	867 @{$OptionsInfo{SpecifiedResidueNumsList}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	868 push @{$OptionsInfo{SpecifiedResidueNumsList}}, @SpecifiedResidueNumsList;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	869
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	870 $OptionsInfo{SpecifiedStartResidueNum} = $StartResidueNum;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	871 $OptionsInfo{SpecifiedEndResidueNum} = $EndResNum;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	872
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	873 @{$OptionsInfo{SpecifiedResidueNamesList}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	874 push @{$OptionsInfo{SpecifiedResidueNamesList}}, @SpecifiedResidueNamesList;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	875
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	876 # Set up a specified residue numbers map...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	877 %{$OptionsInfo{SpecifiedResidueNumsMap}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	878 for $ResidueNum (@{$OptionsInfo{SpecifiedResidueNumsList}}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	879 $OptionsInfo{SpecifiedResidueNumsMap}{$ResidueNum} = $ResidueNum;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	880 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	881
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	882 # Set up a specified residue names map...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	883 %{$OptionsInfo{SpecifiedResidueNamesMap}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	884 for $ResidueName (@{$OptionsInfo{SpecifiedResidueNamesList}}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	885 $OptionsInfo{SpecifiedResidueNamesMap}{lc $ResidueName} = lc $ResidueName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	886 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	887
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	888 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	889
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	890 # Process specified atom options...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	891 sub ProcessAtomsOptions {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	892 my($AtomNum, $StartAtomNum, $EndAtomNum, $AtomName, @SpecifiedAtomNumsList, @SpecifiedAtomNamesList);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	893
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	894 @SpecifiedAtomNumsList = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	895 ($StartAtomNum, $EndAtomNum) = (0, 0);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	896
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	897 @SpecifiedAtomNamesList = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	898
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	899 if ($OptionsInfo{Mode} =~ /^(AtomNums\|AtomsRange\|AtomNames)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	900 if (!$Options{atoms}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	901 die "Error: You must specify a value for \"--Atoms\" option in \"AtomNums, AtomsRange, or AtomNames\" \"-m, --mode\". \n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	902 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	903 $OptionsInfo{Atoms} = $Options{atoms};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	904 $OptionsInfo{Atoms} =~ s/ //g;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	905
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	906 if ($OptionsInfo{Mode} =~ /^AtomNames$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	907 @SpecifiedAtomNamesList = split /\,/, $OptionsInfo{Atoms};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	908 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	909 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	910 @SpecifiedAtomNumsList = split /\,/, $OptionsInfo{Atoms};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	911 for $AtomNum (@SpecifiedAtomNumsList) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	912 if (!IsPositiveInteger($AtomNum)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	913 die "Error: Invalid atom number value, $AtomNum, for \"--Atoms\" option during \"AtomNums\" or \"AtomsRange\"value of \"-m --mode\" option: Atom number must be a positive integer.\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	914 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	915 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	916 if ($OptionsInfo{Mode} =~ /^AtomsRange$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	917 if (@SpecifiedAtomNumsList != 2) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	918 die "Error: Invalid number of atom number values, ", scalar(@SpecifiedAtomNumsList), ", for \"--Atoms\" option during \"AtomsRange\" value of \"-m --mode\" option: The number of values must be 2 corresponding to start and end atom numbers.\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	919 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	920 if ($SpecifiedAtomNumsList[0] > $SpecifiedAtomNumsList[1]) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	921 die "Error: Invalid atom number values, @SpecifiedAtomNumsList, for \"--Atoms\" option during \"AtomsRange\" value of \"-m --mode\" option: The start atom number must be less than end atom number.\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	922 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	923 ($StartAtomNum, $EndAtomNum) = @SpecifiedAtomNumsList;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	924 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	925 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	926 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	927 elsif ($OptionsInfo{Mode} =~ /^CAlphas$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	928 @SpecifiedAtomNamesList = ("CA");
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	929 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	930
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	931 @{$OptionsInfo{SpecifiedAtomNumsList}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	932 push @{$OptionsInfo{SpecifiedAtomNumsList}}, @SpecifiedAtomNumsList;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	933
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	934 $OptionsInfo{SpecifiedStartAtomNum} = $StartAtomNum;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	935 $OptionsInfo{SpecifiedEndAtomNum} = $EndAtomNum;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	936
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	937 @{$OptionsInfo{SpecifiedAtomNamesList}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	938 push @{$OptionsInfo{SpecifiedAtomNamesList}}, @SpecifiedAtomNamesList;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	939
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	940 # Set up a specified residue numbers map...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	941 %{$OptionsInfo{SpecifiedAtomNumsMap}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	942 for $AtomNum (@{$OptionsInfo{SpecifiedAtomNumsList}}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	943 $OptionsInfo{SpecifiedAtomNumsMap}{$AtomNum} = $AtomNum;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	944 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	945
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	946 # Set up a specified residue names map...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	947 %{$OptionsInfo{SpecifiedAtomNamesMap}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	948 for $AtomName (@{$OptionsInfo{SpecifiedAtomNamesList}}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	949 $OptionsInfo{SpecifiedAtomNamesMap}{lc $AtomName} = lc $AtomName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	950 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	951
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	952 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	953
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	954 # Process specified distance options...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	955 sub ProcessDistanceOptions {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	956 my(@SpecifiedDistanceOrigin) = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	957
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	958 $OptionsInfo{MaxExtractionDistance} = $Options{distance};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	959 $OptionsInfo{ExtractionDistanceMode} = $Options{distancemode};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	960 $OptionsInfo{ExtractionDistanceOrigin} = $Options{distanceorigin} ? $Options{distanceorigin} : '';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	961 $OptionsInfo{DistanceSelectionMode} = $Options{distanceselectionmode};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	962
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	963 if ($OptionsInfo{Mode} =~ /^Distance$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	964 if (!$Options{distanceorigin}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	965 die "Error: You must specify a value for \"--distanceorigin\" option in \"Distance\" \"-m, --mode\". \n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	966 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	967 @SpecifiedDistanceOrigin = split /\,/, $Options{distanceorigin};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	968 if ($OptionsInfo{ExtractionDistanceMode} =~ /^Atom$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	969 if (@SpecifiedDistanceOrigin != 2) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	970 die "Error: Invalid number of values, ", scalar(@SpecifiedDistanceOrigin), " for option \"distanceorigin\" option during \"Atom\" value of \"--distancemode\" : The number of values must be 2.\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	971 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	972 if (!IsPositiveInteger($SpecifiedDistanceOrigin[0])) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	973 die "Error: Invalid atom number value, ", $SpecifiedDistanceOrigin[0], ", for option \"distanceorigin\" option during \"Atom\" value of \"--distancemode\". Allowed values: > 0\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	974 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	975 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	976 elsif ($OptionsInfo{ExtractionDistanceMode} =~ /^Hetatm$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	977 if (@SpecifiedDistanceOrigin != 2) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	978 die "Error: Invalid number of values, ", scalar(@SpecifiedDistanceOrigin), " for option \"distanceorigin\" option during \"Hetatm\" value of \"--distancemode\" : The number of values must be 2.\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	979 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	980 if (!IsPositiveInteger($SpecifiedDistanceOrigin[0])) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	981 die "Error: Invalid hetatm number value, ", $SpecifiedDistanceOrigin[0], ", for option \"distanceorigin\" option during \"Hetatm\" value of \"--distancemode\". Allowed values: > 0\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	982 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	983 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	984 elsif ($OptionsInfo{ExtractionDistanceMode} =~ /^Residue$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	985 if (!(@SpecifiedDistanceOrigin == 2 \|\| @SpecifiedDistanceOrigin == 3)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	986 die "Error: Invalid number of values, ", scalar(@SpecifiedDistanceOrigin), " for option \"distanceorigin\" option during \"Residue\" value of \"--distancemode\" : The number of values must be either 2 or 3.\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	987 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	988 if (!IsPositiveInteger($SpecifiedDistanceOrigin[0])) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	989 die "Error: Invalid residue number value, ", $SpecifiedDistanceOrigin[0], ", for option \"distanceorigin\" option during \"Residue\" value of \"--distancemode\". Allowed values: > 0\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	990 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	991 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	992 elsif ($OptionsInfo{ExtractionDistanceMode} =~ /^XYZ$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	993 if (@SpecifiedDistanceOrigin != 3) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	994 die "Error: Invalid number of values, ", scalar(@SpecifiedDistanceOrigin), " for option \"distanceorigin\" option during \"XYZ\" value of \"--distancemode\" : The number of values must be 3.\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	995 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	996 my($Value);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	997 for $Value (@SpecifiedDistanceOrigin) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	998 if (!IsNumerical($Value)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	999 die "Error: Invalid coordinate value, ", $SpecifiedDistanceOrigin[0], ", for option \"distanceorigin\" option during \"XYZ\" value of \"--distancemode\". Allowed values: numerical\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1000 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1001 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1002 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1003 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1004 @{$OptionsInfo{SpecifiedExtractionDistanceOrigin}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1005 push @{$OptionsInfo{SpecifiedExtractionDistanceOrigin}}, @SpecifiedDistanceOrigin;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1006
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1007 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1008
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1009 # Retrieve information about PDB files...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1010 sub RetrievePDBFilesInfo {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1011 my($Index, $PDBFile, $PDBRecordLinesRef, $ChainID, $ChainLabel, $ChainsAndResiduesInfoRef, $Mode, $FileDir, $FileName, $FileExt, $OutFileName, $OutFileRoot, @SpecifiedChains, @DistanceOrigin, @OutFileNames, @ChainLabels, @ChainSequenceIDs, @ChainSequenceIDsPrefix);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1012
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1013 %PDBFilesInfo = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1014 @{$PDBFilesInfo{FileOkay}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1015 @{$PDBFilesInfo{OutFileRoot}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1016 @{$PDBFilesInfo{OutFileNames}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1017 @{$PDBFilesInfo{ChainLabels}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1018 @{$PDBFilesInfo{ChainSequenceIDs}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1019 @{$PDBFilesInfo{ChainSequenceIDsPrefix}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1020 @{$PDBFilesInfo{SpecifiedChains}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1021 @{$PDBFilesInfo{DistanceOrigin}} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1022
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1023 FILELIST: for $Index (0 .. $#PDBFilesList) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1024 $PDBFilesInfo{FileOkay}[$Index] = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1025
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1026 $PDBFilesInfo{OutFileRoot}[$Index] = '';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1027 @{$PDBFilesInfo{OutFileNames}[$Index]} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1028 @{$PDBFilesInfo{OutFileNames}[$Index]} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1029 @{$PDBFilesInfo{ChainLabels}[$Index]} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1030 @{$PDBFilesInfo{ChainSequenceIDs}[$Index]} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1031 @{$PDBFilesInfo{ChainSequenceIDsPrefix}[$Index]} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1032 @{$PDBFilesInfo{SpecifiedChains}[$Index]} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1033 @{$PDBFilesInfo{DistanceOrigin}[$Index]} = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1034
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1035 $PDBFile = $PDBFilesList[$Index];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1036 if (!(-e $PDBFile)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1037 warn "Warning: Ignoring file $PDBFile: It doesn't exist\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1038 next FILELIST;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1039 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1040 if (!CheckFileType($PDBFile, "pdb")) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1041 warn "Warning: Ignoring file $PDBFile: It's not a PDB file\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1042 next FILELIST;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1043 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1044 if (! open PDBFILE, "$PDBFile") {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1045 warn "Warning: Ignoring file $PDBFile: Couldn't open it: $! \n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1046 next FILELIST;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1047 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1048 close PDBFILE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1049
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1050 # Get PDB data...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1051 $PDBRecordLinesRef = ReadPDBFile($PDBFile);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1052 if ($OptionsInfo{Mode} =~ /^Sequences$/i && $OptionsInfo{SequenceRecordSource} =~ /^SeqRes$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1053 $ChainsAndResiduesInfoRef = GetChainsAndResidues($PDBRecordLinesRef, 'SeqRes');
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1054 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1055 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1056 $ChainsAndResiduesInfoRef = GetChainsAndResidues($PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1057 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1058 if (!scalar @{$ChainsAndResiduesInfoRef->{ChainIDs}}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1059 warn "Warning: Ignoring file $PDBFile: No chains found \n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1060 next FILELIST;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1061 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1062
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1063 # Make sure specified chains exist in PDB file...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1064 @SpecifiedChains = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1065 if ($OptionsInfo{ChainsToExtract} =~ /^Specified$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1066 for $ChainID (@{$OptionsInfo{SpecifiedChains}}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1067 if (exists $ChainsAndResiduesInfoRef->{Residues}{$ChainID}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1068 push @SpecifiedChains, $ChainID;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1069 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1070 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1071 warn "Warning: Ignoring file $PDBFile: Specified chain, $ChainID, in \"-c, --chains\" option doesn't exist.\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1072 next FILELIST;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1073 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1074 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1075 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1076 elsif ($OptionsInfo{ChainsToExtract} =~ /^First$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1077 push @SpecifiedChains, $ChainsAndResiduesInfoRef->{ChainIDs}[0];
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1078 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1079 elsif ($OptionsInfo{ChainsToExtract} =~ /^All$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1080 push @SpecifiedChains, @{$ChainsAndResiduesInfoRef->{ChainIDs}};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1081 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1082 # Setup chain labels to use for sequence IDs and generating output files...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1083 @ChainLabels = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1084 for $ChainID (@SpecifiedChains) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1085 $ChainLabel = $ChainID; $ChainLabel =~ s/^None//ig;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1086 $ChainLabel = "Chain${ChainLabel}";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1087 push @ChainLabels, $ChainLabel;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1088 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1089
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1090 # Make sure specified distance origin is valid...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1091 @DistanceOrigin = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1092 if ($OptionsInfo{Mode} =~ /^Distance$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1093 if ($OptionsInfo{ExtractionDistanceMode} =~ /^(Atom\|Hetatm)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1094 my($RecordType, $SpecifiedAtomName, $SpecifiedAtomNumber, $RecordFound, $AtomNumber, $AtomName, $AlternateLocation, $ResidueName, $ResidueNumber, $InsertionCode, $X, $Y, $Z, $RecordLine);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1095 $RecordType = $OptionsInfo{ExtractionDistanceMode};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1096 ($SpecifiedAtomNumber, $SpecifiedAtomName) = @{$OptionsInfo{SpecifiedExtractionDistanceOrigin}};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1097 $RecordFound = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1098 LINE: for $RecordLine (@{$PDBRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1099 if (!(IsAtomRecordType($RecordLine) \|\| IsHetatmRecordType($RecordLine))) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1100 next LINE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1101 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1102 ($AtomNumber, $AtomName, $AlternateLocation, $ResidueName, $ChainID, $ResidueNumber, $InsertionCode, $X, $Y, $Z) = ParseAtomRecordLine($RecordLine);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1103 $AtomName = RemoveLeadingAndTrailingWhiteSpaces($AtomName);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1104 if (($RecordType =~ /^Atom$/i && IsAtomRecordType($RecordLine)) \|\| ($RecordType =~ /^Hetatm$/i && IsHetatmRecordType($RecordLine))) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1105 if ($AtomNumber == $SpecifiedAtomNumber && $AtomName eq $SpecifiedAtomName) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1106 $RecordFound = 1;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1107 last LINE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1108 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1109 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1110 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1111 if (!$RecordFound) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1112 warn "Warning: Ignoring file $PDBFile: ", uc($RecordType), " record corresponding to \"--distanceorigin\" option value, $OptionsInfo{ExtractionDistanceOrigin}, doesn't exist.\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1113 next FILELIST;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1114 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1115 push @DistanceOrigin, ($X, $Y, $Z);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1116 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1117 elsif ($OptionsInfo{ExtractionDistanceMode} =~ /^Residue$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1118 my($SpecifiedResidueNumber, $SpecifiedResidueName, $SpecifiedChainID, $RecordFound, $AtomNumber, $AtomName, $AlternateLocation, $ResidueName, $ChainID, $ResidueNumber, $InsertionCode, $X, $Y, $Z, $RecordLine);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1119 $SpecifiedChainID = '';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1120 if (@{$OptionsInfo{SpecifiedExtractionDistanceOrigin}} == 3) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1121 ($SpecifiedResidueNumber, $SpecifiedResidueName, $SpecifiedChainID) = @{$OptionsInfo{SpecifiedExtractionDistanceOrigin}};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1122 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1123 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1124 ($SpecifiedResidueNumber, $SpecifiedResidueName) = @{$OptionsInfo{SpecifiedExtractionDistanceOrigin}};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1125 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1126 $RecordFound = 0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1127 LINE: for $RecordLine (@{$PDBRecordLinesRef}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1128 if (!(IsAtomRecordType($RecordLine) \|\| IsHetatmRecordType($RecordLine))) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1129 next LINE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1130 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1131 ($AtomNumber, $AtomName, $AlternateLocation, $ResidueName, $ChainID, $ResidueNumber, $InsertionCode, $X, $Y, $Z) = ParseAtomRecordLine($RecordLine);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1132 $ResidueName = RemoveLeadingAndTrailingWhiteSpaces($ResidueName);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1133 $ChainID = RemoveLeadingAndTrailingWhiteSpaces($ChainID);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1134 if ($SpecifiedChainID && ($SpecifiedChainID ne $ChainID)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1135 next LINE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1136 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1137 if ($ResidueNumber == $SpecifiedResidueNumber && $ResidueName eq $SpecifiedResidueName) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1138 # Store coordinates for all the atoms...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1139 $RecordFound = 1;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1140 push @DistanceOrigin, ($X, $Y, $Z);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1141 next LINE;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1142 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1143 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1144 if (!$RecordFound) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1145 warn "Warning: Ignoring file $PDBFile: ATOM/HETATM record corresponding to \"--distanceorigin\" option value, $OptionsInfo{ExtractionDistanceOrigin}, doesn't exist.\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1146 next FILELIST;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1147 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1148 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1149 elsif ($OptionsInfo{ExtractionDistanceMode} =~ /^XYZ$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1150 push @DistanceOrigin, @{$OptionsInfo{SpecifiedExtractionDistanceOrigin}};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1151 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1152 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1153 # Setup output file names...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1154 @OutFileNames = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1155 $FileDir = ""; $FileName = ""; $FileExt = "";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1156 ($FileDir, $FileName, $FileExt) = ParseFileName($PDBFile);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1157 if ($OptionsInfo{OutFileRoot} && (@PDBFilesList == 1)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1158 my ($RootFileDir, $RootFileName, $RootFileExt) = ParseFileName($OptionsInfo{OutFileRoot});
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1159 if ($RootFileName && $RootFileExt) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1160 $FileName = $RootFileName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1161 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1162 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1163 $FileName = $OptionsInfo{OutFileRoot};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1164 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1165 $OutFileRoot = $FileName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1166 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1167 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1168 $OutFileRoot = $FileName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1169 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1170 $Mode = $OptionsInfo{Mode};
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1171 if ($Mode =~ /^(Atoms\|CAlphas\|AtomNums\|AtomsRange\|AtomNames\|ResidueNums\|ResiduesRange\|ResidueNames\|Distance\|NonWater\|NonHydrogens)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1172 $OutFileName = '';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1173 if ($Mode =~ /^CAlphas$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1174 $OutFileName = "${OutFileRoot}CAlphas.pdb";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1175 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1176 elsif ($Mode =~ /^Atoms$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1177 $OutFileName = "${OutFileRoot}Atoms.pdb";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1178 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1179 elsif ($Mode =~ /^AtomNums$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1180 $OutFileName = "${OutFileRoot}AtomNums.pdb";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1181 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1182 elsif ($Mode =~ /^AtomsRange$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1183 $OutFileName = "${OutFileRoot}AtomsRange.pdb";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1184 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1185 elsif ($Mode =~ /^AtomNames$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1186 $OutFileName = "${OutFileRoot}AtomNames.pdb";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1187 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1188 elsif ($Mode =~ /^ResidueNums$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1189 $OutFileName = "${OutFileRoot}ResidueNums.pdb";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1190 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1191 elsif ($Mode =~ /^ResiduesRange$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1192 $OutFileName = "${OutFileRoot}ResiduesRange.pdb";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1193 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1194 elsif ($Mode =~ /^ResidueNames$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1195 $OutFileName = "${OutFileRoot}ResidueNames.pdb";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1196 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1197 elsif ($Mode =~ /^NonWater$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1198 $OutFileName = "${OutFileRoot}NonWater.pdb";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1199 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1200 elsif ($Mode =~ /^NonHydrogens$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1201 $OutFileName = "${OutFileRoot}NonHydrogens.pdb";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1202 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1203 elsif ($Mode =~ /^Distance$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1204 my($DistanceMode) = '';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1205 if ($OptionsInfo{ExtractionDistanceMode} =~ /^Atom$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1206 $DistanceMode = 'Atom';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1207 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1208 elsif ($OptionsInfo{ExtractionDistanceMode} =~ /^Hetatm$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1209 $DistanceMode = 'Hetatm';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1210 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1211 elsif ($OptionsInfo{ExtractionDistanceMode} =~ /^Residue$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1212 $DistanceMode = 'Residue';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1213 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1214 elsif ($OptionsInfo{ExtractionDistanceMode} =~ /^XYZ$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1215 $DistanceMode = 'XYZ';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1216 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1217 $OutFileName = "${OutFileRoot}DistanceBy${DistanceMode}.pdb";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1218 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1219 push @OutFileNames, $OutFileName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1220 if (!$OptionsInfo{OverwriteFiles} && (-e $OutFileName)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1221 warn "Warning: Ignoring file $PDBFile: The file $OutFileName already exists\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1222 next FILELIST;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1223 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1224 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1225 elsif ($Mode =~ /^(Chains\|Sequences)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1226 if ($OptionsInfo{CombineChainSequences}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1227 $OutFileName = ($Mode =~ /^Chains$/i) ? "${OutFileRoot}ExtractedChains.pdb" : "${OutFileRoot}SequencesChainsCombined.fasta";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1228 push @OutFileNames, $OutFileName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1229 if (!$OptionsInfo{OverwriteFiles} && (-e $OutFileName)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1230 warn "Warning: Ignoring file $PDBFile: The file $OutFileName already exists\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1231 next FILELIST;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1232 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1233 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1234 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1235 for $ChainLabel (@ChainLabels) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1236 $OutFileName = ($Mode =~ /^Chains$/i) ? "${OutFileRoot}${ChainLabel}.pdb" : "${OutFileRoot}Sequences${ChainLabel}.fasta";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1237 push @OutFileNames, $OutFileName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1238 if (!$OptionsInfo{OverwriteFiles} && (-e $OutFileName)) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1239 warn "Warning: Ignoring file $PDBFile: The file $OutFileName already exists\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1240 next FILELIST;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1241 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1242 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1243 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1244 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1245 @ChainSequenceIDs = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1246 @ChainSequenceIDsPrefix = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1247 if ($Mode =~ /^Sequences$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1248 my($HeaderRecordLine, $Classification, $DepositionDate, $IDCode, $IDPrefix);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1249 ($Classification, $DepositionDate, $IDCode) = GetHeaderRecordInformation($PDBRecordLinesRef);
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1250
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1251 if ($OptionsInfo{SequenceIDPrefixSource} =~ /^FileName$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1252 $IDPrefix = $FileName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1253 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1254 elsif ($OptionsInfo{SequenceIDPrefixSource} =~ /^HeaderRecord$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1255 $IDPrefix = IsNotEmpty($IDCode) ? $IDCode : '';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1256 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1257 else {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1258 $IDPrefix = IsNotEmpty($IDCode) ? $IDCode : $FileName;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1259 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1260
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1261 for $ChainLabel (@ChainLabels) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1262 push @ChainSequenceIDsPrefix, $IDPrefix;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1263 push @ChainSequenceIDs, "${IDPrefix}_${ChainLabel}\|PDB";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1264 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1265 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1266
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1267 $PDBFilesInfo{FileOkay}[$Index] = 1;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1268 $PDBFilesInfo{OutFileRoot}[$Index] = $OutFileRoot;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1269
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1270 push @{$PDBFilesInfo{OutFileNames}[$Index]}, @OutFileNames;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1271 push @{$PDBFilesInfo{ChainLabels}[$Index]}, @ChainLabels;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1272 push @{$PDBFilesInfo{ChainSequenceIDsPrefix}[$Index]}, @ChainSequenceIDsPrefix;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1273 push @{$PDBFilesInfo{ChainSequenceIDs}[$Index]}, @ChainSequenceIDs;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1274 push @{$PDBFilesInfo{SpecifiedChains}[$Index]}, @SpecifiedChains;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1275 push @{$PDBFilesInfo{DistanceOrigin}[$Index]}, @DistanceOrigin;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1276 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1277 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1278
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1279
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1280 # Setup script usage and retrieve command line arguments specified using various options...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1281 sub SetupScriptUsage {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1282
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1283 # Retrieve all the options...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1284 %Options = ();
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1285 $Options{chains} = 'First';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1286 $Options{combinechains} = 'no';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1287 $Options{distance} = 10.0;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1288 $Options{distancemode} = 'XYZ';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1289 $Options{distanceselectionmode} = 'ByAtom';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1290 $Options{keepoldrecords} = 'no';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1291 $Options{mode} = 'NonWater';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1292 $Options{modifyheader} = 'yes';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1293 $Options{nonstandardkeep} = 'yes';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1294 $Options{nonstandardcode} = 'X';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1295 $Options{sequencelength} = 80;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1296 $Options{sequenceidprefix} = 'Automatic';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1297 $Options{sequencerecords} = 'Atom';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1298 $Options{waterresiduenames} = 'Automatic';
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1299
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1300 if (!GetOptions(\%Options, "atoms\|a=s", "chains\|c=s", "combinechains=s", "distance\|d=f", "distancemode=s", "distanceorigin=s", "distanceselectionmode=s", "help\|h", "keepoldrecords\|k=s", "mode\|m=s", "modifyheader=s", "nonstandardkeep=s", "nonstandardcode=s", "overwrite\|o", "root\|r=s", "recordmode=s", "residues=s", "sequencelength=i", "sequenceidprefix=s", "sequencerecords=s", "waterresiduenames=s", "workingdir\|w=s")) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1301 die "\nTo get a list of valid options and their values, use \"$ScriptName -h\" or\n\"perl -S $ScriptName -h\" command and try again...\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1302 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1303 if ($Options{workingdir}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1304 if (! -d $Options{workingdir}) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1305 die "Error: The value specified, $Options{workingdir}, for option \"-w --workingdir\" is not a directory name.\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1306 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1307 chdir $Options{workingdir} or die "Error: Couldn't chdir $Options{workingdir}: $! \n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1308 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1309 if ($Options{combinechains} !~ /^(yes\|no)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1310 die "Error: The value specified, $Options{combinechains}, for option \"--CombineChains\" is not valid. Allowed values: yes or no\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1311 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1312 if ($Options{distancemode} !~ /^(Atom\|Hetatm\|Residue\|XYZ)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1313 die "Error: The value specified, $Options{distancemode}, for option \"--DistanceMode\" is not valid. Allowed values: Atom, Hetatm, Residue, or XYZ\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1314 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1315 if ($Options{distanceselectionmode} !~ /^(ByAtom\|ByResidue)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1316 die "Error: The value specified, $Options{distanceselectionmode}, for option \"--DistanceSelectionMode\" is not valid. Allowed values: ByAtom or ByResidue\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1317 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1318 if ($Options{keepoldrecords} !~ /^(yes\|no)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1319 die "Error: The value specified, $Options{keepoldrecords}, for option \"--KeepOldRecords\" is not valid. Allowed values: yes or no\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1320 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1321 if ($Options{mode} !~ /^(Chains\|Sequences\|Atoms\|CAlphas\|AtomNums\|AtomsRange\|AtomNames\|ResidueNums\|ResidueNames\|ResiduesRange\|Distance\|NonWater\|NonHydrogens)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1322 die "Error: The value specified, $Options{mode}, for option \"m, --mode\" is not valid. Allowed values: Chains, Sequences, Atoms, CAlphas, AtomNums, AtomsRange, AtomNames, ResidueNums, ResiduesRange, ResidueNames, Distance, NonWater, NonHydrogens\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1323 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1324 if ($Options{modifyheader} !~ /^(yes\|no)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1325 die "Error: The value specified, $Options{modifyheader}, for option \"--ModifyHeader\" is not valid. Allowed values: yes or no\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1326 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1327 if ($Options{nonstandardkeep} !~ /^(yes\|no)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1328 die "Error: The value specified, $Options{nonstandardkeep}, for option \"--NonStandardKeep\" is not valid. Allowed values: yes or no\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1329 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1330 if ($Options{nonstandardcode} !~ /^(\?\|\-\|X)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1331 die "Error: The value specified, $Options{nonstandardcode}, for option \"--NonStandardCode\" is not valid. Allowed values: ?, -, or X\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1332 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1333 if ($Options{recordmode} && $Options{recordmode} !~ /^(Atom\|Hetatm\|AtomAndHetatm)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1334 die "Error: The value specified, $Options{recordmode}, for option \"--RecordMode\" is not valid. Allowed values: Atom, Hetatm, AtomAndHetatm\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1335 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1336 if (!IsPositiveInteger($Options{sequencelength})) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1337 die "Error: The value specified, $Options{sequencelength}, for option \"--SequenceLength\" is not valid. Allowed values: >0\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1338 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1339 if ($Options{sequencerecords} !~ /^(Atom\|SeqRes)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1340 die "Error: The value specified, $Options{sequencerecords}, for option \"--SequenceRecords\" is not valid. Allowed values: Atom or SeqRes\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1341 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1342 if ($Options{sequenceidprefix} !~ /^(FileName\|HeaderRecord\|Automatic)$/i) {
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1343 die "Error: The value specified, $Options{sequenceidprefix}, for option \"--SequenceIDPrefix\" is not valid. Allowed values: FileName, HeaderRecord, or AutomaticAtom\n";
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1344 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1345 }
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1346
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1347 __END__
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1348
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1349 =head1 NAME
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1350
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1351 ExtractFromPDBFiles.pl - Extract specific data from PDBFile(s)
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1352
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1353 =head1 SYNOPSIS
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1354
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1355 ExtractFromPDBFiles.pl PDBFile(s)...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1356
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1357 ExtractFromPDBFiles.pl [B<-a, --Atoms> "AtomNum, [AtomNum...]" \| "StartAtomNum, EndAtomNum" \|
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1358 "AtomName, [AtomName...]"] [B<-c, --chains> First \| All \| "ChainID, [ChainID,...]"]
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1359 [<--CombineChains> yes \| no] [B<-d, --distance> number] [B<--DistanceMode> Atom \| Hetatm \| Residue \| XYZ]
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1360 [B<--DistanceOrigin> "AtomNumber, AtomName" \| "HetatmNumber, HetAtmName" \| "ResidueNumber, ResidueName, [ChainID]" \| "X,Y,Z">]
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1361 [<--DistanceSelectionMode> ByAtom \| ByResidue] [B<-h, --help>] [B<-k, --KeepOldRecords> yes \| no]
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1362 [B<-m, --mode > Chains \| Sequences \| Atoms \| CAlphas \| AtomNums \| AtomsRange \| AtomNames \|
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1363 ResidueNums \| ResiduesRange \| ResidueNames \| Distance \| NonWater \| NonHydrogens]
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1364 [B<--ModifyHeader> yes \| no] [B<--NonStandardKeep> yes \| no] [B<--NonStandardCode> character]
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1365 [B<-o, --overwrite>] [B<-r, --root> rootname] B<--RecordMode> I<Atom \| Hetatm \| AtomAndHetatm>]
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1366 [B<--Residues> "ResidueNum,[ResidueNum...]" \| StartResidueNum,EndResiduNum ]
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1367 [B<--SequenceLength> number] [B<--SequenceRecords> Atom \| SeqRes]
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1368 [B<--SequenceIDPrefix> FileName \| HeaderRecord \| Automatic]
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1369 [B<--WaterResidueNames> Automatic \| "ResidueName, [ResidueName,...]"]
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1370 [B<-w, --WorkingDir> dirname] PDBFile(s)...
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1371
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1372 =head1 DESCRIPTION
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1373
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1374 Extract specific data from I<PDBFile(s)> and generate appropriate PDB or sequence file(s).
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1375 Multiple PDBFile names are separated by spaces. The valid file extension is I<.pdb>.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1376 All other file name extensions are ignored during the wild card expansion. All the PDB files
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1377 in a current directory can be specified either by I<*.pdb> or the current directory name.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1378
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1379 During I<Chains> and I<Sequences> values of B<-m, --mode> option, all ATOM/HETAM records
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1380 for chains after the first model in PDB fils containing data for multiple models are ignored.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1381
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1382 =head1 OPTIONS
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1383
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1384 =over 4
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1385
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1386 =item B<-a, --Atoms> I<"AtomNum,[AtomNum...]" \| "StartAtomNum,EndAtomNum" \| "AtomName,[AtomName...]">
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1387
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1388 Specify which atom records to extract from I<PDBFiles(s)> during I<AtomNums>,
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1389 I<AtomsRange>, and I<AtomNames> value of B<-m, --mode> option: extract records
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1390 corresponding to atom numbers specified in a comma delimited list of atom numbers/names,
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1391 or with in the range of start and end atom numbers. Possible values: I<"AtomNum[,AtomNum,..]">,
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1392 I<StartAtomNum,EndAtomNum>, or I<"AtomName[,AtomName,..]">. Default: I<None>. Examples:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1393
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1394 10
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1395 15,20
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1396 N,CA,C,O
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1397
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1398 =item B<-c, --chains> I<First \| All \| ChainID,[ChainID,...]>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1399
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1400 Specify which chains to extract from I<PDBFile(s)> during I<Chains \| Sequences> value of
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1401 B<-m, --mode> option: first chain, all chains, or a specific list of comma delimited chain IDs.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1402 Possible values: I<First \| All \| ChainID,[ChainID,...]>. Default: I<First>. Examples:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1403
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1404 A
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1405 A,B
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1406 All
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1407
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1408 =item B<--CombineChains> I<yes \| no>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1409
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1410 Specify whether to combine extracted chains data into a single file during I<Chains> or
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1411 I<Sequences> value of B<-m, --mode> option. Possible values: I<yes \| no>. Default: I<no>.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1412
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1413 During I<Chains> value of <-m, --mode> option with I<Yes> value of <--CombineChains>,
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1414 extracted data for specified chains is written into a single file instead of individual file for each
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1415 chain.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1416
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1417 During I<Sequences> value of <-m, --mode> option with I<Yes> value of <--CombineChains>,
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1418 residues sequences for specified chains are extracted and concatenated into a single sequence
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1419 file instead of individual file for each chain.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1420
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1421 =item B<-d, --distance> I<number>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1422
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1423 Specify distance used to extract ATOM/HETATM recods during I<Distance> value of
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1424 B<-m, --mode> option. Default: I<10.0> angstroms.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1425
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1426 B<--RecordMode> option controls type of record lines to extract from I<PDBFile(s)>:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1427 ATOM, HETATM or both.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1428
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1429 =item B<--DistanceMode> I<Atom \| Hetatm \| Residue \| XYZ>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1430
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1431 Specify how to extract ATOM/HETATM records from I<PDBFile(s)> during I<Distance> value of
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1432 B<-m, --mode> option: extract all the records within a certain distance specifed by B<-d, --distance>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1433 from an atom or hetro atom record, a residue, or any artbitrary point. Possible values: I<Atom \|
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1434 Hetatm \| Residue \| XYZ>. Default: I<XYZ>.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1435
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1436 During I<Residue> value of B<--distancemode>, distance of ATOM/HETATM records is calculated from
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1437 all the atoms in the residue and the records are selected as long as any atom of the residue lies with
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1438 in the distace specified using B<-d, --distance> option.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1439
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1440 B<--RecordMode> option controls type of record lines to extract from I<PDBFile(s)>:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1441 ATOM, HETATM or both.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1442
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1443 =item B<--DistanceSelectionMode> I<ByAtom \| ByResidue>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1444
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1445 Specify how how to extract ATOM/HETATM records from I<PDBFile(s)> during I<Distance> value of
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1446 B<-m, --mode> option for all values of B<--DistanceMode> option: extract only those ATOM/HETATM
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1447 records that meet specified distance criterion; extract all records corresponding to a residue as
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1448 long as one of the ATOM/HETATM record in the residue satisfies specified distance criterion. Possible
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1449 values: I<ByAtom, ByResidue>. Default value: I<ByAtom>.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1450
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1451 =item B<--DistanceOrigin> I<"AtomNumber,AtomName" \| "HetatmNumber,HetAtmName" \| "ResidueNumber,ResidueName[,ChainID]" \| "X,Y,Z">
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1452
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1453 This value is B<--distancemode> specific. In general, it identifies a point used to select
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1454 other ATOM/HETATMS with in a specific distance from this point.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1455
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1456 For I<Atom> value of B<--distancemode>, this option corresponds to an atom specification.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1457 Format: I<AtomNumber,AtomName>. Example:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1458
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1459 455,CA
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1460
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1461 For I<Hetatm> value of B<--distancemode>, this option corresponds to a hetatm specification.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1462 Format: I<HetatmNumber,HetAtmName>. Example:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1463
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1464 5295,C1
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1465
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1466 For I<Residue> value of B<--distancemode>, this option corresponds to a residue specification.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1467 Format: I<ResidueNumber, ResidueName[,ChainID]>. Example:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1468
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1469 78,MSE
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1470 977,RET,A
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1471 978,RET,B
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1472
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1473 For I<XYZ> value of B<--distancemode>, this option corresponds to a coordinate of an
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1474 arbitrary point. Format: I<X,Y,X>. Example:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1475
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1476 10.044,19.261,-4.292
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1477
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1478 B<--RecordMode> option controls type of record lines to extract from I<PDBFile(s)>:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1479 ATOM, HETATM or both.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1480
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1481 =item B<-h, --help>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1482
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1483 Print this help message.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1484
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1485 =item B<-k, --KeepOldRecords> I<yes \| no>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1486
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1487 Specify whether to transfer old non ATOM and HETATM records from input PDBFile(s) to new
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1488 PDBFile(s) during I<Chains \| Atoms \| HetAtms \| CAlphas \| Distance\| NonWater \| NonHydrogens>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1489 value of B<-m --mode> option. By default, except for the HEADER record, all
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1490 other unnecessary non ATOM/HETATM records are dropped during the
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1491 generation of new PDB files. Possible values: I<yes \| no>. Default: I<no>.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1492
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1493 =item B<-m, --mode > I<Chains \| Sequences \| Atoms \| CAlphas \| AtomNums \| AtomsRange \| AtomNames \| ResidueNums \| ResiduesRange \| ResidueNames \| Distance \| NonWater \| NonHydrogens>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1494
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1495 Specify what to extract from I<PDBFile(s)>: I<Chains> - retrieve records for
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1496 specified chains; I<Sequences> - generate sequence files for specific chains;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1497 I<Atoms> - extract atom records; I<CAlphas> - extract atom records for alpha
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1498 carbon atoms; I<AtomNums> - extract atom records for specified atom numbers;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1499 I<AtomsRange> - extract atom records between specified atom number range;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1500 I<AtomNames> - extract atom records for specified atom names; I<ResidueNums>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1501 - extract records for specified residue numbers; I<ResiduesRange> - extract records
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1502 for residues between specified residue number range; I<ResidueNames> - extract
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1503 records for specified residue names; I<Distance> - extract records with in a
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1504 certain distance from a specific position; I<NonWater> - extract records corresponding
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1505 to residues other than water; I<NonHydrogens> - extract non-hydrogen records.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1506
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1507 Possible values: I<Chains, Sequences Atoms, CAlphas, AtomNums, AtomsRange,
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1508 AtomNames, ResidueNums, ResiduesRange, ResidueNames, Distance, NonWater,
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1509 NonHydrogens>. Default value: I<NonWater>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1510
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1511 During the generation of new PDB files, unnecessay CONECT records are dropped.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1512
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1513 For I<Chains> mode, data for appropriate chains specified by B<--c --chains> option
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1514 is extracted from I<PDBFile(s)> and placed into new PDB file(s).
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1515
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1516 For I<Sequences> mode, residues names using various sequence related options are
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1517 extracted for chains specified by B<--c --chains> option from I<PDBFile(s)> and
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1518 FASTA sequence file(s) are generated.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1519
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1520 For I<Distance> mode, all ATOM/HETATM records with in a distance specified
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1521 by B<-d --distance> option from a specific atom, residue or a point indicated by
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1522 B<--distancemode> are extracted and placed into new PDB file(s).
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1523
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1524 For I<NonWater> mode, non water ATOM/HETATM record lines, identified using value of
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1525 B<--WaterResidueNames>, are extracted and written to new PDB file(s).
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1526
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1527 For I<NonHydrogens> mode, ATOM/HETATOM record lines containing element symbol
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1528 other than I<H> are extracted and written to new PDB file(s).
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1529
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1530 For all other options, appropriate ATOM/HETATM records are extracted to generate new
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1531 PDB file(s).
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1532
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1533 B<--RecordMode> option controls type of record lines to extract and process from
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1534 I<PDBFile(s)>: ATOM, HETATM or both.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1535
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1536 =item B<--ModifyHeader> I<yes \| no>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1537
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1538 Specify whether to modify HEADER record during the generation of new PDB files
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1539 for B<-m, --mode> values of I<Chains \| Atoms \| CAlphas \| Distance>. Possible values:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1540 I<yes \| no>. Default: I<yes>. By default, Classification data is replaced by I<Data extracted
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1541 using MayaChemTools> before writing out HEADER record.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1542
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1543 =item B<--NonStandardKeep> I<yes \| no>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1544
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1545 Specify whether to include and convert non-standard three letter residue codes into
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1546 a code specified using B<--nonstandardcode> option and include them into sequence file(s)
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1547 generated during I<Sequences> value of B<-m, --mode> option. Possible values: I<yes \| no>.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1548 Default: I<yes>.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1549
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1550 A warning is also printed about the presence of non-standard residues. Any residue other
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1551 than standard 20 amino acids and 5 nucleic acid is considered non-standard; additionally,
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1552 HETATM residues in chains also tagged as non-standard.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1553
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1554 =item B<--NonStandardCode> I<character>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1555
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1556 A single character code to use for non-standard residues. Default: I<X>. Possible values:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1557 I<?, -, or X>.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1558
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1559 =item B<-o, --overwrite>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1560
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1561 Overwrite existing files.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1562
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1563 =item B<-r, --root> I<rootname>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1564
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1565 New PDB and sequence file name is generated using the root: <Root><Mode>.<Ext>.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1566 Default new file name: <PDBFileName>Chain<ChainID>.pdb for I<Chains> B<mode>;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1567 <PDBFileName>SequenceChain<ChainID>.fasta for I<Sequences> B<mode>;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1568 <PDBFileName>DistanceBy<DistanceMode>.pdb for I<Distance> B<-m, --mode>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1569 <PDBFileName><Mode>.pdb for I<Atoms \| CAlphas \| NonWater \| NonHydrogens> B<-m, --mode>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1570 values. This option is ignored for multiple input files.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1571
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1572 =item B<--RecordMode> I<Atom \| Hetatm \| AtomAndHetatm>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1573
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1574 Specify type of record lines to extract and process from I<PDBFile(s)> during various
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1575 values of B<-m, --mode> option: extract only ATOM record lines; extract only HETATM
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1576 record lines; extract both ATOM and HETATM lines. Possible values: I<Atom \| Hetatm
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1577 \| AtomAndHetatm \| XYZ>. Default during I<Atoms, CAlphas, AtomNums, AtomsRange,
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1578 AtomNames> values of B<-m, --mode> option: I<Atom>; otherwise: I<AtomAndHetatm>.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1579
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1580 This option is ignored during I<Chains, Sequences> values of B<-m, --mode> option.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1581
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1582 =item B<--Residues> I<"ResidueNum,[ResidueNum...]" \| "StartResidueNum,EndResiduNum" \| "ResidueName,[ResidueName...]">
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1583
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1584 Specify which resiude records to extract from I<PDBFiles(s)> during I<ResidueNums>,
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1585 I<ResiduesRange>,and I<ResidueNames> value of B<-m, --mode> option: extract records
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1586 corresponding to residue numbers specified in a comma delimited list of residue numbers/names,
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1587 or with in the range of start and end residue numbers. Possible values: I<"ResidueNum[,ResidueNum,..]">,
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1588 I<StartResidueNum,EndResiduNum>, or I<<"ResidueName[,ResidueName,..]">. Default: I<None>. Examples:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1589
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1590 20
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1591 5,10
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1592 TYR,SER,THR
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1593
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1594 B<--RecordMode> option controls type of record lines to extract from I<PDBFile(s)>:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1595 ATOM, HETATM or both.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1596
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1597 =item B<--SequenceLength> I<number>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1598
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1599 Maximum sequence length per line in sequence file(s). Default: I<80>.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1600
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1601 =item B<--SequenceRecords> I<Atom \| SeqRes>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1602
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1603 Specify which records to use for extracting residue names from I<PDBFiles(s)> during
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1604 I<Sequences> value of B<-m, --mode> option: use ATOM records to compile a list
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1605 of residues in a chain or parse SEQRES record to get a list of residues. Possible values:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1606 I<Atom \| SeqRes>. Default: I<Atom>.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1607
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1608 =item B<--SequenceIDPrefix> I<FileName \| HeaderRecord \| Automatic>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1609
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1610 Specify how to generate a prefix for sequence IDs during I<Sequences> value
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1611 of B<-m, --mode> option: use input file name prefix; retrieve PDB ID from HEADER record;
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1612 or automatically decide the method for generating the prefix. The chain IDs are also
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1613 appended to the prefix. Possible values: I<FileName \| HeaderRecord \| Automatic>.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1614 Default: I<Automatic>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1615
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1616 =item B<--WaterResidueNames> I<Automatic \| "ResidueName,[ResidueName,...]">
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1617
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1618 Identification of water residues during I<NonWater> value of B<-m, --mode> option. Possible values:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1619 I<Automatic \| "ResidueName,[ResidueName,...]">. Default: I<Automatic> - corresponds
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1620 to "HOH,WAT,H20". You can also specify a different comma delimited list of residue names
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1621 to use for water.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1622
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1623 =item B<-w, --WorkingDir> I<dirname>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1624
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1625 Location of working directory. Default: current directory.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1626
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1627 =back
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1628
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1629 =head1 EXAMPLES
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1630
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1631 To extract non-water records from Sample2.pdb file and generate Sample2NonWater.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1632 file, type:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1633
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1634 % ExtractFromPDBFiles.pl Sample2.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1635
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1636 To extract non-water records corresponding to only ATOM records from Sample2.pdb file
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1637 and generate Sample2NonWater.pdb file, type:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1638
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1639 % ExtractFromPDBFiles.pl --RecordMode Atom Sample2.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1640
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1641 To extract non-water records from Sample2.pdb file using HOH or WAT residue name for water along
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1642 with all old non-coordinate records and generate Sample2NewNonWater.pdb file, type:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1643
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1644 % ExtractFromPDBFiles.pl -m NonWater --WaterResidueNames "HOH,WAT"
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1645 -KeepOldRecords Yes -r Sample2New -o Sample2.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1646
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1647 To extract non-hydrogens records from Sample2.pdb file and generate Sample2NonHydrogen.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1648 file, type:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1649
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1650 % ExtractFromPDBFiles.pl -m NonHydrogens Sample2.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1651
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1652 To extract data for first chain in Sample2.pdb and generate Sample2ChainA.pdb, type
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1653 file, type:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1654
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1655 % ExtractFromPDBFiles.pl -m chains -o Sample2.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1656
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1657 To extract data for both chains in Sample2.pdb and generate Sample2ChainA.pdb and
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1658 Sample2ChainB.pdb, type:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1659
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1660 % ExtractFromPDBFiles.pl -m chains -c All -o Sample2.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1661
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1662 To extract data for alpha carbons in Sample2.pdb and generate Sample2CAlphas.pdb, type:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1663
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1664 % ExtractFromPDBFiles.pl -m CAlphas -o Sample2.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1665
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1666 To extract records for specific residue numbers in all chains from Sample2.pdb file and generate
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1667 Sample2ResidueNums.pdb file, type:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1668
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1669 % ExtractFromPDBFiles.pl -m ResidueNums --Residues "3,6"
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1670 Sample2.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1671
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1672 To extract records for a specific range of residue number in all chains from Sample2.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1673 file and generate Sample2ResiduesRange.pdb file, type:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1674
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1675 % ExtractFromPDBFiles.pl -m ResiduesRange --Residues "10,30"
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1676 Sample2.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1677
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1678 To extract data for all ATOM and HETATM records with in 10 angstrom of an atom specifed by
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1679 atom serial number and name "1,N" in Sample2.pdb file and generate Sample2DistanceByAtom.pdb,
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1680 type:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1681
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1682 % ExtractFromPDBFiles.pl -m Distance --DistanceMode Atom
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1683 --DistanceOrigin "1,N" -k No --distance 10 -o Sample2.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1684
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1685 To extract data for all ATOM and HETATM records for complete residues with any atom or hetatm
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1686 less than 10 angstrom of an atom specifed by atom serial number and name "1,N" in Sample2.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1687 file and generate Sample2DistanceByAtom.pdb, type:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1688
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1689 % ExtractFromPDBFiles.pl -m Distance --DistanceMode Atom
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1690 --DistanceOrigin "1,N" --DistanceSelectionMode ByResidue
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1691 -k No --distance 10 -o Sample2.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1692
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1693 To extract data for all ATOM and HETATM records with in 25 angstrom of an arbitrary point "0,0,0"
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1694 in Sample2.pdb file and generate Sample2DistanceByXYZ.pdb, type:
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1695
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1696 % ExtractFromPDBFiles.pl -m Distance --DistanceMode XYZ
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1697 --DistanceOrigin "0,0,0" -k No --distance 25 -o Sample2.pdb
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1698
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1699 =head1 AUTHOR
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1700
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1701 Manish Sud <msud@san.rr.com>
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1702
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1703 =head1 SEE ALSO
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1704
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1705 InfoPDBFiles.pl, ModifyPDBFiles.pl
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1706
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1707 =head1 COPYRIGHT
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1708
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1709 Copyright (C) 2015 Manish Sud. All rights reserved.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1710
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1711 This file is part of MayaChemTools.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1712
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1713 MayaChemTools is free software; you can redistribute it and/or modify it under
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1714 the terms of the GNU Lesser General Public License as published by the Free
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1715 Software Foundation; either version 3 of the License, or (at your option)
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1716 any later version.
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1717
73ae111cf86f Uploaded deepakjadmin parents: diff changeset	1718 =cut

Mercurial > repos > deepakjadmin > mayatool3_test3

annotate mayachemtools/bin/ExtractFromPDBFiles.pl @ 9:ab29fa5c8c1f draft default tip