mayatool3_test2: docs/scripts/txt/AnalyzeSDFilesData.txt annotate

annotate docs/scripts/txt/AnalyzeSDFilesData.txt @ 0:4816e4a8ae95 draft default tip

Uploaded

author	deepakjadmin
date	Wed, 20 Jan 2016 09:23:18 -0500
parents
children

rev	line source
0 4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	1 NAME
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	2 AnalyzeSDFilesData.pl - Analyze numerical data field values in SDFile(s)
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	3
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	4 SYNOPSIS
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	5 AnalyzeSDFilesData.pl SDFile(s)...
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	6
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	7 AnalyzeSDFilesData.pl [--datafields "fieldlabel,[fieldlabel,...]" \| All]
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	8 [--datafieldpairs "fieldlabel,fieldlabel,[fieldlabel,fieldlabel,...]" \|
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	9 AllPairs] [-d, --detail infolevel] [-f, --fast] [--frequencybins number
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	10 \| "number,number,[number,...]"] [-h, --help] [--klargest number]
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	11 [--ksmallest number] [-m, --mode DescriptiveStatisticsBasic \|
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	12 DescriptiveStatisticsAll \| All \| "function1, [function2,...]"]
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	13 [--trimfraction number] [-w, --workingdir dirname] SDFiles(s)...
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	14
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	15 DESCRIPTION
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	16 Analyze numerical data field values in SDFile(s) using a combination
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	17 of various statistical functions; Non-numerical values are simply
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	18 ignored. For Correlation, RSquare, and Covariance analysis, the count
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	19 of valid values in specified data field pairs must be same; otherwise,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	20 column data field pair is ignored. The file names are separated by
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	21 space.The valid file extensions are .sdf and .sd. All other file
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	22 names are ignored. All the SD files in a current directory can be
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	23 specified either by *.sdf or the current directory name.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	24
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	25 OPTIONS
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	26 --datafields "fieldlabel,[fieldlabel,...]" \| Common \| All
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	27 Data fields to use for analysis. Possible values: list of comma
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	28 separated data field labels, data fields common to all records, or
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	29 all data fields. Default value: Common. Examples:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	30
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	31 ALogP,MolWeight,EC50
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	32 "MolWeight,PSA"
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	33
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	34 --datafieldpairs *"fieldlabel,fieldlabel,[fieldlabel,fieldlabel,...]" \|
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	35 CommonPairs \| AllPairs*
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	36 This value is mode specific and is only used for *Correlation,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	37 PearsonCorrelation, or Covariance* value of -m, --mode option. It
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	38 specifies data field label pairs to use for data analysis during
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	39 Correlation and Covariance calculations. Possible values: comma
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	40 delimited list of data field label pairs, data field label pairs
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	41 common to all records, or all data field pairs. Default
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	42 value:CommonPairs. Example:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	43
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	44 MolWeight,EC50,NumN+O,PSA
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	45
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	46 For AllPairs value of --datafieldpairs option, all data field
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	47 label pairs are used for Correlation and Covariance
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	48 calculations.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	49
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	50 -d, --detail infolevel
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	51 Level of information to print about column values being ignored.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	52 Default: 0. Possible values: 0, 1, 2, 3, or 4.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	53
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	54 -f, --fast
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	55 In this mode, all the data field values specified for analysis are
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	56 assumed to contain numerical data and no checking is performed
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	57 before analysis. By default, only numerical data is used for
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	58 analysis; other types of column data is ignored.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	59
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	60 --frequencybins number \| "number,number,[number,...]"
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	61 Specify number of bins or bin range to use for frequency analysis.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	62 Default value: 10
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	63
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	64 Number of bins value along with the smallest and largest value for a
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	65 column is used to group the column values into different groups.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	66
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	67 The bin range list is used to group values for a column into
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	68 different groups; It must contain values in ascending order.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	69 Examples:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	70
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	71 10,20,30
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	72 0.1,0.2,0.3,0.4,0.5
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	73
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	74 The frequency value calculated for a specific bin corresponds to all
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	75 the column values which are greater than the previous bin value and
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	76 less than or equal to the current bin value.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	77
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	78 -h, --help
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	79 Print this help message.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	80
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	81 --klargest number
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	82 Kth largest value to find by KLargest function. Default value:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	83 2. Valid values: positive integers.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	84
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	85 --ksmallest number
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	86 Kth smallest value to find by KSmallest function. Default values:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	87 2. Valid values: positive integers.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	88
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	89 -m, --mode *DescriptiveStatisticsBasic \| DescriptiveStatisticsAll \| All
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	90 \| "function1, [function2,...]"*
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	91 Specify how to analyze data in SDFile(s): calculate basic or all
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	92 descriptive statistics; or use a comma delimited list of supported
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	93 statistical functions. Possible values: *DescriptiveStatisticsBasic
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	94 \| DescriptiveStatisticsAll \| "function1,[function2]..."*. Default
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	95 value: DescriptiveStatisticsBasic
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	96
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	97 DescriptiveStatisticsBasic includes these functions: *Count,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	98 Maximum, Minimum, Mean, Median, Sum, StandardDeviation,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	99 StandardError, Variance*.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	100
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	101 DescriptiveStatisticsAll, in addition to
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	102 DescriptiveStatisticsBasic functions, includes: *GeometricMean,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	103 Frequency, HarmonicMean, KLargest, KSmallest, Kurtosis, Mode,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	104 RSquare, Skewness, TrimMean*.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	105
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	106 All uses complete list of supported functions: *Average,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	107 AverageDeviation, Correlation, Count, Covariance, GeometricMean,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	108 Frequency, HarmonicMean, KLargest, KSmallest, Kurtosis, Maximum,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	109 Minimum, Mean, Median, Mode, RSquare, Skewness, Sum, SumOfSquares,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	110 StandardDeviation, StandardDeviationN, StandardError,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	111 StandardScores, StandardScoresN, TrimMean, Variance, VarianceN*. The
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	112 function names ending with N calculate corresponding values assuming
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	113 an entire population instead of a population sample. Here are the
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	114 formulas for these functions:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	115
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	116 Average: See Mean
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	117
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	118 AverageDeviation: SUM( ABS(x[i] - Xmean) ) / n
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	119
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	120 Correlation: See Pearson Correlation
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	121
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	122 Covariance: SUM( (x[i] - Xmean)(y[i] - Ymean) ) / n
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	123
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	124 GeometricMean: NthROOT( PRODUCT(x[i]) )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	125
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	126 HarmonicMean: 1 / ( SUM(1/x[i]) / n )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	127
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	128 Mean: SUM( x[i] ) / n
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	129
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	130 Median: Xsorted[(n - 1)/2 + 1] for even values of n; (Xsorted[n/2] +
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	131 Xsorted[n/2 + 1])/2 for odd values of n.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	132
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	133 Kurtosis: [ {n(n + 1)/(n - 1)(n - 2)(n - 3)} SUM{ ((x[i] -
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	134 Xmean)/STDDEV)^4 } ] - {3((n - 1)^2)}/{(n - 2)(n-3)}
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	135
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	136 PearsonCorrelation: SUM( (x[i] - Xmean)(y[i] - Ymean) ) / SQRT( SUM(
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	137 (x[i] - Xmean)^2 ) (SUM( (y[i] - Ymean)^2 )) )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	138
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	139 RSquare: PearsonCorrelation^2
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	140
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	141 Skewness: {n/(n - 1)(n - 2)} SUM{ ((x[i] - Xmean)/STDDEV)^3 }
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	142
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	143 StandardDeviation: SQRT ( SUM( (x[i] - Mean)^2 ) / (n - 1) )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	144
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	145 StandardDeviationN: SQRT ( SUM( (x[i] - Mean)^2 ) / n )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	146
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	147 StandardError: StandardDeviation / SQRT( n )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	148
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	149 StandardScore: (x[i] - Mean) / (n - 1)
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	150
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	151 StandardScoreN: (x[i] - Mean) / n
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	152
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	153 Variance: SUM( (x[i] - Xmean)^2 / (n - 1) )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	154
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	155 VarianceN: SUM( (x[i] - Xmean)^2 / n )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	156
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	157 -o, --overwrite
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	158 Overwrite existing files.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	159
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	160 --outdelim comma \| tab \| semicolon
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	161 Output text file delimiter. Possible values: *comma, tab, or
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	162 semicolon* Default value: comma.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	163
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	164 -p, --precision number
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	165 Precision of calculated values in the output file. Default: up to
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	166 2 decimal places. Valid values: positive integers.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	167
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	168 -q, --quote yes \| no
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	169 Put quotes around column values in output text file. Possible
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	170 values: yes or no. Default value: yes.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	171
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	172 -r, --root rootname
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	173 New text file name is generated using the root: <Root>.<Ext>.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	174 Default new file name: <InitialSDFileName><Mode>.<Ext>. Based on the
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	175 specified analysis, <Mode> corresponds to one of these values:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	176 DescriptiveStatisticsBasic, DescriptiveStatisticsAll, AllStatistics,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	177 SpecifiedStatistics, Covariance, Correlation, Frequency, or
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	178 StandardScores. The csv, and tsv <Ext> values are used for
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	179 comma/semicolon, and tab delimited text files respectively. This
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	180 option is ignored for multiple input files.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	181
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	182 --trimfraction number
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	183 Fraction of data to exclude from the top and bottom of the data set
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	184 during TrimMean calculation. Default value: 0.1 Valid values: >
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	185 0 and < 1.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	186
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	187 -w --workingdir text
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	188 Location of working directory. Default: current directory.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	189
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	190 EXAMPLES
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	191 To calculate basic statistics for data in all common data fields and
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	192 generate a NewSample1DescriptiveStatisticsBasic.csv file, type:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	193
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	194 % AnalyzeSDFilesData.pl -o -r NewSample1 Sample1.sdf
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	195
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	196 To calculate basic statistics for MolWeight data field and generate a
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	197 NewSample1DescriptiveStatisticsBasic.csv file, type:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	198
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	199 % AnalyzeSDFilesData.pl --datafields MolWeight -o -r NewSample1
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	200 Sample1.sdf
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	201
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	202 To calculate all available statistics for MolWeight data field and all
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	203 data field pairs, and generate NewSample1DescriptiveStatisticsAll.csv,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	204 NewSample1CorrelationMatrix.csv, NewSample1CorrelationMatrix.csv, and
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	205 NewSample1MolWeightFrequencyAnalysis.csv files, type:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	206
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	207 % AnalyzeSDFilesData.pl -m DescriptiveStatisticsAll --datafields
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	208 MolWeight -o --datafieldpairs AllPairs -r NewSample1 Sample1.sdf
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	209
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	210 To compute frequency distribution of MolWeight data field into five bins
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	211 and generate NewSample1MolWeightFrequencyAnalysis.csv, type:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	212
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	213 % AnalyzeSDFilesData.pl -m Frequency --frequencybins 5 --datafields
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	214 MolWeight -o -r NewSample1 Sample1.sdf
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	215
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	216 To compute frequency distribution of data in MolWeight data field into
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	217 specified bin range values, and generate
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	218 NewSample1MolWeightFrequencyAnalysis.csv, type:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	219
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	220 % AnalyzeSDFilesData.pl -m Frequency --frequencybins "100,200,400"
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	221 --datafields MolWeight -o -r NewSample1 Sample1.sdf
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	222
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	223 To calculate all available statistics for data in all data fields and
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	224 pairs, type:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	225
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	226 % AnalyzeSDFilesData.pl -m All --datafields All --datafieldpairs
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	227 AllPairs -o -r NewSample1 Sample1.sdf
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	228
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	229 AUTHOR
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	230 Manish Sud <msud@san.rr.com>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	231
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	232 SEE ALSO
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	233 FilterSDFiles.pl, InfoSDFiles.pl, SplitSDFiles.pl,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	234 MergeTextFilesWithSD.pl
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	235
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	236 COPYRIGHT
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	237 Copyright (C) 2015 Manish Sud. All rights reserved.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	238
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	239 This file is part of MayaChemTools.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	240
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	241 MayaChemTools is free software; you can redistribute it and/or modify it
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	242 under the terms of the GNU Lesser General Public License as published by
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	243 the Free Software Foundation; either version 3 of the License, or (at
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	244 your option) any later version.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	245

Mercurial > repos > deepakjadmin > mayatool3_test2

annotate docs/scripts/txt/AnalyzeSDFilesData.txt @ 0:4816e4a8ae95 draft default tip