mayatool3_test2: docs/scripts/txt/AnalyzeTextFilesData.txt annotate

annotate docs/scripts/txt/AnalyzeTextFilesData.txt @ 0:4816e4a8ae95 draft default tip

Uploaded

author	deepakjadmin
date	Wed, 20 Jan 2016 09:23:18 -0500
parents
children

rev	line source
0 4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	1 NAME
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	2 AnalyzeTextFilesData.pl - Analyze numerical coulmn data in TextFile(s)
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	3
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	4 SYNOPSIS
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	5 AnalyzeTextFilesData.pl TextFile(s)...
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	6
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	7 AnalyzeTextFilesData.pl [-c, --colmode colnum \| collabel] [--columns
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	8 "colnum,[colnum,...]" \| "collabel,[collabel,...]" \| All] [--columnpairs
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	9 "colnum,colnum,[colnum,colnum]..." \|
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	10 "collabel,collabel,[collabel,collabel]..." \| AllPairs] [-d, --detail
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	11 infolevel] [-f, --fast] [--frequencybins number \|
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	12 "number,number,[number,...]"] [-h, --help] [--indelim comma \| semicolon]
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	13 [--klargest number] [--ksmallest number] [-m, --mode
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	14 DescriptiveStatisticsBasic \| DescriptiveStatisticsAll \| All \|
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	15 "function1, [function2,...]"] [-o, --overwrite] [--outdelim comma \| tab
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	16 \| semicolon] [-p, --precision number] [-q, --quote yes \| no] [-r, --root
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	17 rootname] [--trimfraction number] [-w, --workingdir dirname]
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	18 TextFiles(s)...
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	19
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	20 DESCRIPTION
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	21 Anaylze numerical column data in TextFile(s) using a combination of
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	22 various statistical functions; Non-numerical values are simply ignored.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	23 For Correlation, RSquare, and Covariance analysis, the count of valid
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	24 values in specifed column pair must be same; otherwise, column pair is
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	25 ignored. The file names are separated by space. The valid file
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	26 extensions are .csv and .tsv for comma/semicolon and tab delimited
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	27 text files respectively. All other file names are ignored. All the text
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	28 files in a current directory can be specified by *.csv, *.tsv, or
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	29 the current directory name. The --indelim option determines the format
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	30 of TextFile(s). Any file which doesn't correspond to the format
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	31 indicated by --indelim option is ignored.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	32
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	33 OPTIONS
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	34 -c, --colmode colnum \| collabel
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	35 Specify how columns are identified in TextFile(s): using column
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	36 number or column label. Possible values: colnum or collabel.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	37 Default value: colnum.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	38
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	39 --columns "colnum,[colnum,...]" \| "collabel,[collabel]..." \| All
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	40 This value is mode specific. It's a list of comma delimited columns
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	41 to use for data analysis. Default value: First column.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	42
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	43 This value is ignored during Correlation/Pearson Correlation and
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	44 Covariance data analysis; -coulmnparis option is used instead.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	45
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	46 For colnum value of -c, --colmode option, input values format is:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	47 colnum,colnum,.... Example:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	48
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	49 1,3,5
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	50
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	51 For collabel value of -c, --colmode option, input values format
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	52 is: collabel,collabel,... Example:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	53
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	54 ALogP,MolWeight,EC50
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	55
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	56 --columnpairs *"colnum,colnum,[colnum,colnum,...]" \|
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	57 "collabel,collabel,[collabel,collabel,...]" \| AllPairs*
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	58 This value is mode specific and is only used for *Correlation,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	59 PearsonCorrelation, or Covariance* value of -m, --mode option. It is
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	60 a comma delimited list of column pairs to use for data analysis
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	61 during Correlation and Covariance calculations. Default value:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	62 First column, Second column.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	63
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	64 For colnum value of -c, --colmode option, input values format is:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	65 colnum,colnum,[colnum,colnum].... Example:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	66
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	67 1,3,5,6,1,6
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	68
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	69 For collabel value of -c, --colmode option, input values format
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	70 is: collabel,collabel,[collabel,collabel]... Example:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	71
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	72 MolWeight,EC50,NumN+O,PSA
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	73
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	74 For AllPairs value of --columnparis option, all column pairs are
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	75 used for Correlation and Covariance calculations.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	76
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	77 -d, --detail infolevel
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	78 Level of information to print about column values being ignored.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	79 Default: 1. Possible values: 1, 2, 3, or 4.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	80
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	81 -f, --fast
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	82 In this mode, all the columns specified for analysis are assumed to
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	83 contain numerical data and no checking is performed before analysis.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	84 By default, only numerical data is used for analysis; other types of
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	85 column data is ignored.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	86
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	87 --frequencybins number \| "number,number,[number,...]"
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	88 Specify number of bins or bin range to use for frequency analysis.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	89 Default value: 10
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	90
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	91 Number of bins value along with the smallest and largest value for a
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	92 column is used to group the column values into different groups.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	93
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	94 The bin range list is used to group values for a column into
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	95 different groups; It must contain values in ascending order.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	96 Examples:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	97
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	98 10,20,30
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	99 0.1,0.2,0.3,0.4,0.5
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	100
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	101 The frequency value calculated for a specific bin corresponds to all
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	102 the column values which are greater than the previous bin value and
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	103 less than or equal to the current bin value.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	104
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	105 -h, --help
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	106 Print this help message.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	107
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	108 --indelim comma \| semicolon
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	109 Input delimiter for CSV TextFile(s). Possible values: *comma or
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	110 semicolon. Default value: comma*. For TSV files, this option is
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	111 ignored and tab is used as a delimiter.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	112
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	113 --klargest number
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	114 Kth largest value to find by KLargest function. Default value: 2
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	115 Valid values: positive integers.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	116
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	117 --ksmallest number
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	118 Kth smallest value to find by KSmallest function. Default value:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	119 2. Valid values: positive integers.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	120
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	121 -m, --mode *DescriptiveStatisticsBasic \| DescriptiveStatisticsAll \| All
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	122 \| "function1, [function2,...]"*
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	123 Specify how to analyze data in TextFile(s): calculate basic or all
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	124 descriptive statistics; or use a comma delimited list of supported
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	125 statistical functions. Possible values: *DescriptiveStatisticsBasic
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	126 \| DescriptiveStatisticsAll \| "function1,[function2]..."*. Default
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	127 value: DescriptiveStatisticsBasic
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	128
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	129 DescriptiveStatisticsBasic includes these functions: *Count,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	130 Maximum, Minimum, Mean, Median, Sum, StandardDeviation,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	131 StandardError, Variance*.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	132
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	133 DescriptiveStatisticsAll, in addition to
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	134 DescriptiveStatisticsBasic functions, includes: *GeometricMean,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	135 Frequency, HarmonicMean, KLargest, KSmallest, Kurtosis, Mode,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	136 RSquare, Skewness, TrimMean*.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	137
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	138 All uses complete list of supported functions: *Average,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	139 AverageDeviation, Correlation, Count, Covariance, GeometricMean,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	140 Frequency, HarmonicMean, KLargest, KSmallest, Kurtosis, Maximum,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	141 Minimum, Mean, Median, Mode, RSquare, Skewness, Sum, SumOfSquares,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	142 StandardDeviation, StandardDeviationN, StandardError,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	143 StandardScores, StandardScoresN, TrimMean, Variance, VarianceN*. The
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	144 function names ending with N calculate corresponding values assuming
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	145 an entire population instead of a population sample.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	146
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	147 Here are the formulas for these functions:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	148
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	149 Average: See Mean
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	150
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	151 AverageDeviation: SUM( ABS(x[i] - Xmean) ) / n
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	152
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	153 Correlation: See Pearson Correlation
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	154
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	155 Covariance: SUM( (x[i] - Xmean)(y[i] - Ymean) ) / n
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	156
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	157 GeometricMean: NthROOT( PRODUCT(x[i]) )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	158
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	159 HarmonicMean: 1 / ( SUM(1/x[i]) / n )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	160
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	161 Mean: SUM( x[i] ) / n
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	162
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	163 Median: Xsorted[(n - 1)/2 + 1] for even values of n; (Xsorted[n/2] +
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	164 Xsorted[n/2 + 1])/2 for odd values of n.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	165
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	166 Kurtosis: [ {n(n + 1)/(n - 1)(n - 2)(n - 3)} SUM{ ((x[i] -
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	167 Xmean)/STDDEV)^4 } ] - {3((n - 1)^2)}/{(n - 2)(n-3)}
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	168
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	169 PearsonCorrelation: SUM( (x[i] - Xmean)(y[i] - Ymean) ) / SQRT( SUM(
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	170 (x[i] - Xmean)^2 ) (SUM( (y[i] - Ymean)^2 )) )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	171
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	172 RSquare: PearsonCorrelation^2
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	173
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	174 Skewness: {n/(n - 1)(n - 2)} SUM{ ((x[i] - Xmean)/STDDEV)^3 }
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	175
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	176 StandardDeviation: SQRT ( SUM( (x[i] - Mean)^2 ) / (n - 1) )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	177
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	178 StandardDeviationN: SQRT ( SUM( (x[i] - Mean)^2 ) / n )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	179
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	180 StandardError: StandardDeviation / SQRT( n )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	181
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	182 StandardScore: (x[i] - Mean) / (n - 1)
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	183
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	184 StandardScoreN: (x[i] - Mean) / n
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	185
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	186 Variance: SUM( (x[i] - Xmean)^2 / (n - 1) )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	187
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	188 VarianceN: SUM( (x[i] - Xmean)^2 / n )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	189
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	190 -o, --overwrite
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	191 Overwrite existing files.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	192
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	193 --outdelim comma \| tab \| semicolon
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	194 Output text file delimiter. Possible values: *comma, tab, or
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	195 semicolon* Default value: comma.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	196
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	197 -p, --precision number
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	198 Precision of calculated values in the output file. Default: up to
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	199 2 decimal places. Valid values: positive integers.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	200
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	201 -q, --quote yes \| no
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	202 Put quotes around column values in output text file. Possible
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	203 values: yes or no. Default value: yes.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	204
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	205 -r, --root rootname
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	206 New text file name is generated using the root: <Root>.<Ext>.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	207 Default new file name: <InitialTextFileName><Mode>.<Ext>. Based on
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	208 the specified analysis, <Mode> corresponds to one of these values:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	209 DescriptiveStatisticsBasic, DescriptiveStatisticsAll, AllStatistics,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	210 SpecifiedStatistics, Covariance, Correlation, Frequency, or
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	211 StandardScores. The csv, and tsv <Ext> values are used for
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	212 comma/semicolon, and tab delimited text files respectively. This
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	213 option is ignored for multiple input files.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	214
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	215 --trimfraction number
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	216 Fraction of data to exclude from the top and bottom of the data set
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	217 during TrimMean calculation. Default value: 0.1. Valid values: >
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	218 0 and < 1.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	219
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	220 -w --workingdir text
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	221 Location of working directory. Default: current directory.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	222
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	223 EXAMPLES
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	224 To calculate basic statistics for data in first column and generate a
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	225 NewSample1DescriptiveStatisticsBasic.csv file, type:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	226
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	227 % AnalyzeTextFilesData.pl -o -r NewSample1 Sample1.csv
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	228
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	229 To calculate basic statistics for data in third column and generate a
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	230 NewSample1DescriptiveStatisticsBasic.csv file, type:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	231
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	232 % AnalyzeTextFilesData.pl --columns 3 -o -r NewSample1 Sample1.csv
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	233
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	234 To calculate basic statistics for data in MolWeight column and generate
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	235 a NewSample1DescriptiveStatisticsBasic.csv file, type:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	236
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	237 % AnalyzeTextFilesData.pl -colmode collabel --columns MolWeight -o
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	238 -r NewSample1 Sample1.csv
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	239
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	240 To calculate all available statistics for data in third column and all
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	241 column pairs, and generate NewSample1DescriptiveStatisticsAll.csv,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	242 NewSample1CorrelationMatrix.csv, NewSample1CorrelationMatrix.csv, and
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	243 NewSample1MolWeightFrequencyAnalysis.csv files, type:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	244
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	245 % AnalyzeTextFilesData.pl -m DescriptiveStatisticsAll --columns 3 -o
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	246 --columnpairs AllPairs -r NewSample1 Sample1.csv
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	247
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	248 To compute frequency distribution of data in third column into five bins
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	249 and generate NewSample1MolWeightFrequencyAnalysis.csv, type:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	250
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	251 % AnalyzeTextFilesData.pl -m Frequency --frequencybins 5 --columns 3
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	252 -o -r NewSample1 Sample1.csv
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	253
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	254 To compute frequency distribution of data in third column into specified
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	255 bin range values, and generate NewSample1MolWeightFrequencyAnalysis.csv,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	256 type:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	257
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	258 % AnalyzeTextFilesData.pl -m Frequency --frequencybins "100,200,400"
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	259 --columns 3 -o -r NewSample1 Sample1.csv
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	260
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	261 To calculate all available statistics for data in all columns and column
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	262 pairs, type:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	263
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	264 % AnalyzeTextFilesData.pl -m All --columns All --columnpairs
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	265 AllPairs -o -r NewSample1 Sample1.csv
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	266
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	267 AUTHOR
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	268 Manish Sud <msud@san.rr.com>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	269
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	270 SEE ALSO
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	271 JoinTextFiles.pl, MergeTextFilesWithSD.pl, ModifyTextFilesFormat.pl,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	272 SplitTextFiles.pl, TextFilesToHTML.pl
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	273
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	274 COPYRIGHT
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	275 Copyright (C) 2015 Manish Sud. All rights reserved.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	276
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	277 This file is part of MayaChemTools.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	278
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	279 MayaChemTools is free software; you can redistribute it and/or modify it
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	280 under the terms of the GNU Lesser General Public License as published by
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	281 the Free Software Foundation; either version 3 of the License, or (at
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	282 your option) any later version.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	283

Mercurial > repos > deepakjadmin > mayatool3_test2

annotate docs/scripts/txt/AnalyzeTextFilesData.txt @ 0:4816e4a8ae95 draft default tip