mayatool3_test2: docs/scripts/html/AnalyzeTextFilesData.html annotate

author	deepakjadmin
date	Wed, 20 Jan 2016 09:23:18 -0500
parents
children

rev	line source
0 4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	1 <html>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	2 <head>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	3 <title>MayaChemTools:Documentation:AnalyzeTextFilesData.pl</title>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	4 <meta http-equiv="content-type" content="text/html;charset=utf-8">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	5 <link rel="stylesheet" type="text/css" href="../../css/MayaChemTools.css">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	6 </head>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	7 <body leftmargin="20" rightmargin="20" topmargin="10" bottommargin="10">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	8 <br/>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	9 <center>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	10 <a href="http://www.mayachemtools.org" title="MayaChemTools Home"><img src="../../images/MayaChemToolsLogo.gif" border="0" alt="MayaChemTools"></a>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	11 </center>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	12 <br/>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	13 <div class="DocNav">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	14 <table width="100%" border=0 cellpadding=0 cellspacing=2>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	15 <tr align="left" valign="top"><td width="33%" align="left"><a href="./AnalyzeSequenceFilesData.html" title="AnalyzeSequenceFilesData.html">Previous</a>  <a href="./index.html" title="Table of Contents">TOC</a>  <a href="./AtomNeighborhoodsFingerprints.html" title="AtomNeighborhoodsFingerprints.html">Next</a></td><td width="34%" align="middle"><strong>AnalyzeTextFilesData.pl</strong></td><td width="33%" align="right"><a href="././code/AnalyzeTextFilesData.html" title="View source code">Code</a> \| <a href="./../pdf/AnalyzeTextFilesData.pdf" title="PDF US Letter Size">PDF</a> \| <a href="./../pdfgreen/AnalyzeTextFilesData.pdf" title="PDF US Letter Size with narrow margins: www.changethemargins.com">PDFGreen</a> \| <a href="./../pdfa4/AnalyzeTextFilesData.pdf" title="PDF A4 Size">PDFA4</a> \| <a href="./../pdfa4green/AnalyzeTextFilesData.pdf" title="PDF A4 Size with narrow margins: www.changethemargins.com">PDFA4Green</a></td></tr>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	16 </table>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	17 </div>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	18 <p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	19 </p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	20 <h2>NAME</h2>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	21 <p>AnalyzeTextFilesData.pl - Analyze numerical coulmn data in TextFile(s)</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	22 <p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	23 </p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	24 <h2>SYNOPSIS</h2>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	25 <p>AnalyzeTextFilesData.pl TextFile(s)...</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	26 <p>AnalyzeTextFilesData.pl [<strong>-c, --colmode</strong> colnum \| collabel] [<strong>--columns</strong> "colnum,[colnum,...]" \| "collabel,[collabel,...]" \| All]
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	27 [<strong>--columnpairs</strong> "colnum,colnum,[colnum,colnum]..." \| "collabel,collabel,[collabel,collabel]..." \| AllPairs]
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	28 [<strong>-d, --detail</strong> infolevel] [<strong>-f, --fast</strong>] [<strong>--frequencybins</strong> number \| "number,number,[number,...]"] [<strong>-h, --help</strong>]
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	29 [<strong>--indelim</strong> comma \| semicolon] [<strong>--klargest</strong> number] [<strong>--ksmallest</strong> number]
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	30 [<strong>-m, --mode</strong> DescriptiveStatisticsBasic \| DescriptiveStatisticsAll \| All \| "function1, [function2,...]"]
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	31 [<strong>-o, --overwrite</strong>] [<strong>--outdelim</strong> comma \| tab \| semicolon] [<strong>-p, --precision</strong> number]
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	32 [<strong>-q, --quote</strong> yes \| no] [<strong>-r, --root</strong> rootname] [<strong>--trimfraction</strong> number] [<strong>-w, --workingdir</strong> dirname] TextFiles(s)...</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	33 <p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	34 </p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	35 <h2>DESCRIPTION</h2>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	36 <p>Anaylze numerical column data in <em>TextFile(s)</em> using a combination of various statistical
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	37 functions; Non-numerical values are simply ignored. For <em>Correlation, RSquare, and Covariance</em>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	38 analysis, the count of valid values in specifed column pair must be same; otherwise, column
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	39 pair is ignored. The file names are separated by space. The valid file extensions are <em>.csv</em>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	40 and <em>.tsv</em> for comma/semicolon and tab delimited text files respectively. All other
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	41 file names are ignored. All the text files in a current directory can be specified by
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	42 <em>.csv</em>, <em>.tsv</em>, or the current directory name. The <strong>--indelim</strong> option determines
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	43 the format of <em>TextFile(s)</em>. Any file which doesn't correspond to the format indicated
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	44 by <strong>--indelim</strong> option is ignored.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	45 <p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	46 </p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	47 <h2>OPTIONS</h2>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	48 <dl>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	49 <dt><strong><strong>-c, --colmode</strong> <em>colnum \| collabel</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	50 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	51 <p>Specify how columns are identified in TextFile(s): using column number or column
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	52 label. Possible values: <em>colnum or collabel</em>. Default value: <em>colnum</em>.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	53 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	54 <dt><strong><strong>--columns</strong> <em>"colnum,[colnum,...]" \| "collabel,[collabel]..." \| All</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	55 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	56 <p>This value is mode specific. It's a list of comma delimited columns to use
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	57 for data analysis. Default value: <em>First column</em>.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	58 <p>This value is ignored during <em>Correlation/Pearson Correlation</em> and <em>Covariance</em>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	59 data analysis; <strong>-coulmnparis</strong> option is used instead.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	60 <p>For <em>colnum</em> value of <strong>-c, --colmode</strong> option, input values format is:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	61 <em>colnum,colnum,...</em>. Example:</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	62 <div class="OptionsBox">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	63 1,3,5</div>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	64 <p>For <em>collabel</em> value of <strong>-c, --colmode</strong> option, input values format is:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	65 <em>collabel,collabel,..</em>. Example:</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	66 <div class="OptionsBox">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	67 ALogP,MolWeight,EC50</div>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	68 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	69 <dt><strong><strong>--columnpairs</strong> <em>"colnum,colnum,[colnum,colnum,...]" \| "collabel,collabel,[collabel,collabel,...]" \| AllPairs</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	70 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	71 <p>This value is mode specific and is only used for <em>Correlation, PearsonCorrelation, or
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	72 Covariance</em> value of <strong>-m, --mode</strong> option. It is a comma delimited list of column pairs
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	73 to use for data analysis during <em>Correlation</em> and <em>Covariance</em> calculations. Default value:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	74 <em>First column, Second column</em>.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	75 <p>For <em>colnum</em> value of <strong>-c, --colmode</strong> option, input values format is:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	76 <em>colnum,colnum,[colnum,colnum]...</em>. Example:</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	77 <div class="OptionsBox">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	78 1,3,5,6,1,6</div>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	79 <p>For <em>collabel</em> value of <strong>-c, --colmode</strong> option, input values format is:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	80 <em>collabel,collabel,[collabel,collabel]..</em>. Example:</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	81 <div class="OptionsBox">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	82 MolWeight,EC50,NumN+O,PSA</div>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	83 <p>For <em>AllPairs</em> value of <strong>--columnparis</strong> option, all column pairs are used for <em>Correlation</em>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	84 and <em>Covariance</em> calculations.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	85 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	86 <dt><strong><strong>-d, --detail</strong> <em>infolevel</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	87 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	88 <p>Level of information to print about column values being ignored. Default: <em>1</em>. Possible values:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	89 1, 2, 3, or 4.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	90 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	91 <dt><strong><strong>-f, --fast</strong></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	92 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	93 <p>In this mode, all the columns specified for analysis are assumed to contain numerical
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	94 data and no checking is performed before analysis. By default, only numerical data is
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	95 used for analysis; other types of column data is ignored.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	96 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	97 <dt><strong><strong>--frequencybins</strong> <em>number \| "number,number,[number,...]"</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	98 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	99 <p>Specify number of bins or bin range to use for frequency analysis. Default value: <em>10</em></p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	100 <p>Number of bins value along with the smallest and largest value for a column is used to
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	101 group the column values into different groups.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	102 <p>The bin range list is used to group values for a column into different groups; It must contain
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	103 values in ascending order. Examples:</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	104 <div class="OptionsBox">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	105 10,20,30
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	106 <br/> 0.1,0.2,0.3,0.4,0.5</div>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	107 <p>The frequency value calculated for a specific bin corresponds to all the column values
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	108 which are greater than the previous bin value and less than or equal to the current bin value.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	109 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	110 <dt><strong><strong>-h, --help</strong></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	111 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	112 <p>Print this help message.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	113 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	114 <dt><strong><strong>--indelim</strong> <em>comma \| semicolon</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	115 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	116 <p>Input delimiter for CSV <em>TextFile(s)</em>. Possible values: <em>comma or semicolon</em>.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	117 Default value: <em>comma</em>. For TSV files, this option is ignored and <em>tab</em> is used as a
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	118 delimiter.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	119 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	120 <dt><strong><strong>--klargest</strong> <em>number</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	121 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	122 <p>Kth largest value to find by <em>KLargest</em> function. Default value: <em>2</em> Valid values: positive
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	123 integers.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	124 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	125 <dt><strong><strong>--ksmallest</strong> <em>number</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	126 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	127 <p>Kth smallest value to find by <em>KSmallest</em> function. Default value: <em>2</em>. Valid values: positive
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	128 integers.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	129 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	130 <dt><strong><strong>-m, --mode</strong> <em>DescriptiveStatisticsBasic \| DescriptiveStatisticsAll \| All \| "function1, [function2,...]"</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	131 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	132 <p>Specify how to analyze data in TextFile(s): calculate basic or all descriptive statistics; or
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	133 use a comma delimited list of supported statistical functions. Possible values:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	134 <em>DescriptiveStatisticsBasic \| DescriptiveStatisticsAll \| "function1,[function2]..."</em>. Default
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	135 value: <em>DescriptiveStatisticsBasic</em></p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	136 <p><em>DescriptiveStatisticsBasic</em> includes these functions: <em>Count, Maximum, Minimum, Mean,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	137 Median, Sum, StandardDeviation, StandardError, Variance</em>.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	138 <p><em>DescriptiveStatisticsAll</em>, in addition to <em>DescriptiveStatisticsBasic</em> functions, includes:
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	139 <em>GeometricMean, Frequency, HarmonicMean, KLargest, KSmallest, Kurtosis, Mode, RSquare,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	140 Skewness, TrimMean</em>.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	141 <p><em>All</em> uses complete list of supported functions: <em>Average, AverageDeviation, Correlation,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	142 Count, Covariance, GeometricMean, Frequency, HarmonicMean, KLargest, KSmallest, Kurtosis,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	143 Maximum, Minimum, Mean, Median, Mode, RSquare, Skewness, Sum,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	144 SumOfSquares, StandardDeviation, StandardDeviationN, StandardError, StandardScores,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	145 StandardScoresN, TrimMean, Variance, VarianceN</em>. The function names ending with N
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	146 calculate corresponding values assuming an entire population instead of a population sample.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	147 <p>Here are the formulas for these functions:</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	148 <p>Average: See Mean</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	149 <p>AverageDeviation: SUM( ABS(x[i] - Xmean) ) / n</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	150 <p>Correlation: See Pearson Correlation</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	151 <p>Covariance: SUM( (x[i] - Xmean)(y[i] - Ymean) ) / n</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	152 <p>GeometricMean: NthROOT( PRODUCT(x[i]) )</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	153 <p>HarmonicMean: 1 / ( SUM(1/x[i]) / n )</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	154 <p>Mean: SUM( x[i] ) / n</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	155 <p>Median: Xsorted[(n - 1)/2 + 1] for even values of n; (Xsorted[n/2] + Xsorted[n/2 + 1])/2
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	156 for odd values of n.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	157 <p>Kurtosis: [ {n(n + 1)/(n - 1)(n - 2)(n - 3)} SUM{ ((x[i] - Xmean)/STDDEV)^4 } ] -
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	158 {3((n - 1)^2)}/{(n - 2)(n-3)}</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	159 <p>PearsonCorrelation: SUM( (x[i] - Xmean)(y[i] - Ymean) ) / SQRT( SUM( (x[i] - Xmean)^2 )
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	160 (SUM( (y[i] - Ymean)^2 )) )</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	161 <p>RSquare: PearsonCorrelation^2</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	162 <p>Skewness: {n/(n - 1)(n - 2)} SUM{ ((x[i] - Xmean)/STDDEV)^3 }</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	163 <p>StandardDeviation: SQRT ( SUM( (x[i] - Mean)^2 ) / (n - 1) )</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	164 <p>StandardDeviationN: SQRT ( SUM( (x[i] - Mean)^2 ) / n )</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	165 <p>StandardError: StandardDeviation / SQRT( n )</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	166 <p>StandardScore: (x[i] - Mean) / (n - 1)</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	167 <p>StandardScoreN: (x[i] - Mean) / n</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	168 <p>Variance: SUM( (x[i] - Xmean)^2 / (n - 1) )</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	169 <p>VarianceN: SUM( (x[i] - Xmean)^2 / n )</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	170 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	171 <dt><strong><strong>-o, --overwrite</strong></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	172 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	173 <p>Overwrite existing files.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	174 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	175 <dt><strong><strong>--outdelim</strong> <em>comma \| tab \| semicolon</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	176 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	177 <p>Output text file delimiter. Possible values: <em>comma, tab, or semicolon</em>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	178 Default value: <em>comma</em>.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	179 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	180 <dt><strong><strong>-p, --precision</strong> <em>number</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	181 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	182 <p>Precision of calculated values in the output file. Default: up to <em>2</em> decimal places.
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	183 Valid values: positive integers.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	184 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	185 <dt><strong><strong>-q, --quote</strong> <em>yes \| no</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	186 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	187 <p>Put quotes around column values in output text file. Possible values: <em>yes or
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	188 no</em>. Default value: <em>yes</em>.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	189 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	190 <dt><strong><strong>-r, --root</strong> <em>rootname</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	191 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	192 <p>New text file name is generated using the root: <Root>.<Ext>. Default new file
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	193 name: <InitialTextFileName><Mode>.<Ext>. Based on the specified analysis,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	194 <Mode> corresponds to one of these values: DescriptiveStatisticsBasic,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	195 DescriptiveStatisticsAll, AllStatistics, SpecifiedStatistics, Covariance, Correlation,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	196 Frequency, or StandardScores. The csv, and tsv <Ext> values are used for
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	197 comma/semicolon, and tab delimited text files respectively. This option is ignored for
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	198 multiple input files.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	199 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	200 <dt><strong><strong>--trimfraction</strong> <em>number</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	201 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	202 <p>Fraction of data to exclude from the top and bottom of the data set during
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	203 <em>TrimMean</em> calculation. Default value: <em>0.1</em>. Valid values: > 0 and < 1.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	204 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	205 <dt><strong><strong>-w --workingdir</strong> <em>text</em></strong></dt>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	206 <dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	207 <p>Location of working directory. Default: current directory.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	208 </dd>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	209 </dl>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	210 <p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	211 </p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	212 <h2>EXAMPLES</h2>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	213 <p>To calculate basic statistics for data in first column and generate a
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	214 NewSample1DescriptiveStatisticsBasic.csv file, type:</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	215 <div class="ExampleBox">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	216 % AnalyzeTextFilesData.pl -o -r NewSample1 Sample1.csv</div>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	217 <p>To calculate basic statistics for data in third column and generate a
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	218 NewSample1DescriptiveStatisticsBasic.csv file, type:</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	219 <div class="ExampleBox">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	220 % AnalyzeTextFilesData.pl --columns 3 -o -r NewSample1 Sample1.csv</div>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	221 <p>To calculate basic statistics for data in MolWeight column and generate a
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	222 NewSample1DescriptiveStatisticsBasic.csv file, type:</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	223 <div class="ExampleBox">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	224 % AnalyzeTextFilesData.pl -colmode collabel --columns MolWeight -o
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	225 -r NewSample1 Sample1.csv</div>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	226 <p>To calculate all available statistics for data in third column and all column pairs,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	227 and generate NewSample1DescriptiveStatisticsAll.csv, NewSample1CorrelationMatrix.csv,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	228 NewSample1CorrelationMatrix.csv, and NewSample1MolWeightFrequencyAnalysis.csv files,
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	229 type:</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	230 <div class="ExampleBox">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	231 % AnalyzeTextFilesData.pl -m DescriptiveStatisticsAll --columns 3 -o
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	232 --columnpairs AllPairs -r NewSample1 Sample1.csv</div>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	233 <p>To compute frequency distribution of data in third column into five bins and
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	234 generate NewSample1MolWeightFrequencyAnalysis.csv, type:</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	235 <div class="ExampleBox">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	236 % AnalyzeTextFilesData.pl -m Frequency --frequencybins 5 --columns 3
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	237 -o -r NewSample1 Sample1.csv</div>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	238 <p>To compute frequency distribution of data in third column into specified bin range
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	239 values, and generate NewSample1MolWeightFrequencyAnalysis.csv, type:</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	240 <div class="ExampleBox">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	241 % AnalyzeTextFilesData.pl -m Frequency --frequencybins "100,200,400"
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	242 --columns 3 -o -r NewSample1 Sample1.csv</div>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	243 <p>To calculate all available statistics for data in all columns and column pairs, type:</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	244 <div class="ExampleBox">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	245 % AnalyzeTextFilesData.pl -m All --columns All --columnpairs
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	246 AllPairs -o -r NewSample1 Sample1.csv</div>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	247 <p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	248 </p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	249 <h2>AUTHOR</h2>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	250 <p><a href="mailto:msud@san.rr.com">Manish Sud</a></p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	251 <p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	252 </p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	253 <h2>SEE ALSO</h2>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	254 <p><a href="./JoinTextFiles.html">JoinTextFiles.pl</a>,&nbsp<a href="./MergeTextFilesWithSD.html">MergeTextFilesWithSD.pl</a>,&nbsp<a href="./ModifyTextFilesFormat.html">ModifyTextFilesFormat.pl</a>,&nbsp<a href="./SplitTextFiles.html">SplitTextFiles.pl</a>,&nbsp<a href="./TextFilesToHTML.html">TextFilesToHTML.pl</a>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	255 </p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	256 <p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	257 </p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	258 <h2>COPYRIGHT</h2>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	259 <p>Copyright (C) 2015 Manish Sud. All rights reserved.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	260 <p>This file is part of MayaChemTools.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	261 <p>MayaChemTools is free software; you can redistribute it and/or modify it under
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	262 the terms of the GNU Lesser General Public License as published by the Free
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	263 Software Foundation; either version 3 of the License, or (at your option)
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	264 any later version.</p>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	265 <p>&nbsp</p><p>&nbsp</p><div class="DocNav">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	266 <table width="100%" border=0 cellpadding=0 cellspacing=2>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	267 <tr align="left" valign="top"><td width="33%" align="left"><a href="./AnalyzeSequenceFilesData.html" title="AnalyzeSequenceFilesData.html">Previous</a>  <a href="./index.html" title="Table of Contents">TOC</a>  <a href="./AtomNeighborhoodsFingerprints.html" title="AtomNeighborhoodsFingerprints.html">Next</a></td><td width="34%" align="middle"><strong>March 29, 2015</strong></td><td width="33%" align="right"><strong>AnalyzeTextFilesData.pl</strong></td></tr>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	268 </table>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	269 </div>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	270 <br />
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	271 <center>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	272 <img src="../../images/h2o2.png">
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	273 </center>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	274 </body>
4816e4a8ae95 Uploaded deepakjadmin parents: diff changeset	275 </html>

0

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

1 <html>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

2 <head>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

3 <title>MayaChemTools:Documentation:AnalyzeTextFilesData.pl</title>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

4 <meta http-equiv="content-type" content="text/html;charset=utf-8">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

5 <link rel="stylesheet" type="text/css" href="../../css/MayaChemTools.css">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

6 </head>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

7 <body leftmargin="20" rightmargin="20" topmargin="10" bottommargin="10">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

8

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

9 <center>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

10 <a href="http://www.mayachemtools.org" title="MayaChemTools Home"><img src="../../images/MayaChemToolsLogo.gif" border="0" alt="MayaChemTools"></a>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

11 </center>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

12

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

13 <div class="DocNav">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

14 <table width="100%" border=0 cellpadding=0 cellspacing=2>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

15 <tr align="left" valign="top"><td width="33%" align="left"><a href="./AnalyzeSequenceFilesData.html" title="AnalyzeSequenceFilesData.html">Previous</a>  <a href="./index.html" title="Table of Contents">TOC</a>  <a href="./AtomNeighborhoodsFingerprints.html" title="AtomNeighborhoodsFingerprints.html">Next</a></td><td width="34%" align="middle">AnalyzeTextFilesData.pl</td><td width="33%" align="right"><a href="././code/AnalyzeTextFilesData.html" title="View source code">Code</a> | <a href="./../pdf/AnalyzeTextFilesData.pdf" title="PDF US Letter Size">PDF</a> | <a href="./../pdfgreen/AnalyzeTextFilesData.pdf" title="PDF US Letter Size with narrow margins: www.changethemargins.com">PDFGreen</a> | <a href="./../pdfa4/AnalyzeTextFilesData.pdf" title="PDF A4 Size">PDFA4</a> | <a href="./../pdfa4green/AnalyzeTextFilesData.pdf" title="PDF A4 Size with narrow margins: www.changethemargins.com">PDFA4Green</a></td></tr>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

16 </table>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

17 </div>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

18

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

19

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

20 <h2>NAME</h2>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

21 AnalyzeTextFilesData.pl - Analyze numerical coulmn data in TextFile(s)

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

22

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

23

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

24 <h2>SYNOPSIS</h2>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

25 AnalyzeTextFilesData.pl TextFile(s)...

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

26 AnalyzeTextFilesData.pl [-c, --colmode colnum | collabel] [--columns "colnum,[colnum,...]" | "collabel,[collabel,...]" | All]

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

27 [--columnpairs "colnum,colnum,[colnum,colnum]..." | "collabel,collabel,[collabel,collabel]..." | AllPairs]

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

28 [-d, --detail infolevel] [-f, --fast] [--frequencybins number | "number,number,[number,...]"] [-h, --help]

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

29 [--indelim comma | semicolon] [--klargest number] [--ksmallest number]

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

30 [-m, --mode DescriptiveStatisticsBasic | DescriptiveStatisticsAll | All | "function1, [function2,...]"]

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

31 [-o, --overwrite] [--outdelim comma | tab | semicolon] [-p, --precision number]

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

32 [-q, --quote yes | no] [-r, --root rootname] [--trimfraction number] [-w, --workingdir dirname] TextFiles(s)...

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

33

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

34

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

35 <h2>DESCRIPTION</h2>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

36 Anaylze numerical column data in TextFile(s) using a combination of various statistical

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

37 functions; Non-numerical values are simply ignored. For Correlation, RSquare, and Covariance

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

38 analysis, the count of valid values in specifed column pair must be same; otherwise, column

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

39 pair is ignored. The file names are separated by space. The valid file extensions are .csv

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

40 and .tsv for comma/semicolon and tab delimited text files respectively. All other

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

41 file names are ignored. All the text files in a current directory can be specified by

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

42 *.csv, *.tsv, or the current directory name. The --indelim option determines

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

43 the format of TextFile(s). Any file which doesn't correspond to the format indicated

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

44 by --indelim option is ignored.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

45

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

46

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

47 <h2>OPTIONS</h2>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

48 <dl>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

49 <dt>-c, --colmode colnum | collabel</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

50 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

51 Specify how columns are identified in TextFile(s): using column number or column

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

52 label. Possible values: colnum or collabel. Default value: colnum.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

53 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

54 <dt>--columns "colnum,[colnum,...]" | "collabel,[collabel]..." | All</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

55 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

56 This value is mode specific. It's a list of comma delimited columns to use

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

57 for data analysis. Default value: First column.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

58 This value is ignored during Correlation/Pearson Correlation and Covariance

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

59 data analysis; -coulmnparis option is used instead.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

60 For colnum value of -c, --colmode option, input values format is:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

61 colnum,colnum,.... Example:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

62 <div class="OptionsBox">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

63 1,3,5</div>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

64 For collabel value of -c, --colmode option, input values format is:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

65 collabel,collabel,... Example:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

66 <div class="OptionsBox">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

67 ALogP,MolWeight,EC50</div>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

68 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

69 <dt>--columnpairs "colnum,colnum,[colnum,colnum,...]" | "collabel,collabel,[collabel,collabel,...]" | AllPairs</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

70 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

71 This value is mode specific and is only used for Correlation, PearsonCorrelation, or

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

72 Covariance value of -m, --mode option. It is a comma delimited list of column pairs

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

73 to use for data analysis during Correlation and Covariance calculations. Default value:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

74 First column, Second column.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

75 For colnum value of -c, --colmode option, input values format is:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

76 colnum,colnum,[colnum,colnum].... Example:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

77 <div class="OptionsBox">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

78 1,3,5,6,1,6</div>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

79 For collabel value of -c, --colmode option, input values format is:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

80 collabel,collabel,[collabel,collabel]... Example:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

81 <div class="OptionsBox">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

82 MolWeight,EC50,NumN+O,PSA</div>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

83 For AllPairs value of --columnparis option, all column pairs are used for Correlation

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

84 and Covariance calculations.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

85 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

86 <dt>-d, --detail infolevel</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

87 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

88 Level of information to print about column values being ignored. Default: 1. Possible values:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

89 1, 2, 3, or 4.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

90 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

91 <dt>-f, --fast</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

92 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

93 In this mode, all the columns specified for analysis are assumed to contain numerical

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

94 data and no checking is performed before analysis. By default, only numerical data is

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

95 used for analysis; other types of column data is ignored.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

96 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

97 <dt>--frequencybins number | "number,number,[number,...]"</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

98 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

99 Specify number of bins or bin range to use for frequency analysis. Default value: 10

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

100 Number of bins value along with the smallest and largest value for a column is used to

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

101 group the column values into different groups.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

102 The bin range list is used to group values for a column into different groups; It must contain

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

103 values in ascending order. Examples:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

104 <div class="OptionsBox">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

105 10,20,30

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

106 0.1,0.2,0.3,0.4,0.5</div>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

107 The frequency value calculated for a specific bin corresponds to all the column values

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

108 which are greater than the previous bin value and less than or equal to the current bin value.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

109 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

110 <dt>-h, --help</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

111 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

112 Print this help message.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

113 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

114 <dt>--indelim comma | semicolon</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

115 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

116 Input delimiter for CSV TextFile(s). Possible values: comma or semicolon.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

117 Default value: comma. For TSV files, this option is ignored and tab is used as a

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

118 delimiter.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

119 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

120 <dt>--klargest number</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

121 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

122 Kth largest value to find by KLargest function. Default value: 2 Valid values: positive

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

123 integers.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

124 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

125 <dt>--ksmallest number</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

126 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

127 Kth smallest value to find by KSmallest function. Default value: 2. Valid values: positive

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

128 integers.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

129 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

130 <dt>-m, --mode DescriptiveStatisticsBasic | DescriptiveStatisticsAll | All | "function1, [function2,...]"</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

131 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

132 Specify how to analyze data in TextFile(s): calculate basic or all descriptive statistics; or

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

133 use a comma delimited list of supported statistical functions. Possible values:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

134 DescriptiveStatisticsBasic | DescriptiveStatisticsAll | "function1,[function2]...". Default

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

135 value: DescriptiveStatisticsBasic

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

136 DescriptiveStatisticsBasic includes these functions: Count, Maximum, Minimum, Mean,

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

137 Median, Sum, StandardDeviation, StandardError, Variance.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

138 DescriptiveStatisticsAll, in addition to DescriptiveStatisticsBasic functions, includes:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

139 GeometricMean, Frequency, HarmonicMean, KLargest, KSmallest, Kurtosis, Mode, RSquare,

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

140 Skewness, TrimMean.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

141 All uses complete list of supported functions: Average, AverageDeviation, Correlation,

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

142 Count, Covariance, GeometricMean, Frequency, HarmonicMean, KLargest, KSmallest, Kurtosis,

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

143 Maximum, Minimum, Mean, Median, Mode, RSquare, Skewness, Sum,

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

144 SumOfSquares, StandardDeviation, StandardDeviationN, StandardError, StandardScores,

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

145 StandardScoresN, TrimMean, Variance, VarianceN. The function names ending with N

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

146 calculate corresponding values assuming an entire population instead of a population sample.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

147 Here are the formulas for these functions:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

148 Average: See Mean

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

149 AverageDeviation: SUM( ABS(x[i] - Xmean) ) / n

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

150 Correlation: See Pearson Correlation

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

151 Covariance: SUM( (x[i] - Xmean)(y[i] - Ymean) ) / n

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

152 GeometricMean: NthROOT( PRODUCT(x[i]) )

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

153 HarmonicMean: 1 / ( SUM(1/x[i]) / n )

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

154 Mean: SUM( x[i] ) / n

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

155 Median: Xsorted[(n - 1)/2 + 1] for even values of n; (Xsorted[n/2] + Xsorted[n/2 + 1])/2

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

156 for odd values of n.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

157 Kurtosis: [ {n(n + 1)/(n - 1)(n - 2)(n - 3)} SUM{ ((x[i] - Xmean)/STDDEV)^4 } ] -

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

158 {3((n - 1)^2)}/{(n - 2)(n-3)}

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

159 PearsonCorrelation: SUM( (x[i] - Xmean)(y[i] - Ymean) ) / SQRT( SUM( (x[i] - Xmean)^2 )

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

160 (SUM( (y[i] - Ymean)^2 )) )

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

161 RSquare: PearsonCorrelation^2

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

162 Skewness: {n/(n - 1)(n - 2)} SUM{ ((x[i] - Xmean)/STDDEV)^3 }

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

163 StandardDeviation: SQRT ( SUM( (x[i] - Mean)^2 ) / (n - 1) )

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

164 StandardDeviationN: SQRT ( SUM( (x[i] - Mean)^2 ) / n )

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

165 StandardError: StandardDeviation / SQRT( n )

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

166 StandardScore: (x[i] - Mean) / (n - 1)

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

167 StandardScoreN: (x[i] - Mean) / n

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

168 Variance: SUM( (x[i] - Xmean)^2 / (n - 1) )

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

169 VarianceN: SUM( (x[i] - Xmean)^2 / n )

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

170 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

171 <dt>-o, --overwrite</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

172 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

173 Overwrite existing files.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

174 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

175 <dt>--outdelim comma | tab | semicolon</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

176 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

177 Output text file delimiter. Possible values: comma, tab, or semicolon

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

178 Default value: comma.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

179 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

180 <dt>-p, --precision number</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

181 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

182 Precision of calculated values in the output file. Default: up to 2 decimal places.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

183 Valid values: positive integers.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

184 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

185 <dt>-q, --quote yes | no</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

186 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

187 Put quotes around column values in output text file. Possible values: yes or

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

188 no. Default value: yes.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

189 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

190 <dt>-r, --root rootname</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

191 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

192 New text file name is generated using the root: <Root>.<Ext>. Default new file

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

193 name: <InitialTextFileName><Mode>.<Ext>. Based on the specified analysis,

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

194 <Mode> corresponds to one of these values: DescriptiveStatisticsBasic,

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

195 DescriptiveStatisticsAll, AllStatistics, SpecifiedStatistics, Covariance, Correlation,

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

196 Frequency, or StandardScores. The csv, and tsv <Ext> values are used for

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

197 comma/semicolon, and tab delimited text files respectively. This option is ignored for

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

198 multiple input files.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

199 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

200 <dt>--trimfraction number</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

201 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

202 Fraction of data to exclude from the top and bottom of the data set during

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

203 TrimMean calculation. Default value: 0.1. Valid values: > 0 and < 1.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

204 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

205 <dt>-w --workingdir text</dt>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

206 <dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

207 Location of working directory. Default: current directory.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

208 </dd>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

209 </dl>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

210

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

211

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

212 <h2>EXAMPLES</h2>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

213 To calculate basic statistics for data in first column and generate a

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

214 NewSample1DescriptiveStatisticsBasic.csv file, type:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

215 <div class="ExampleBox">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

216 % AnalyzeTextFilesData.pl -o -r NewSample1 Sample1.csv</div>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

217 To calculate basic statistics for data in third column and generate a

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

218 NewSample1DescriptiveStatisticsBasic.csv file, type:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

219 <div class="ExampleBox">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

220 % AnalyzeTextFilesData.pl --columns 3 -o -r NewSample1 Sample1.csv</div>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

221 To calculate basic statistics for data in MolWeight column and generate a

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

222 NewSample1DescriptiveStatisticsBasic.csv file, type:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

223 <div class="ExampleBox">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

224 % AnalyzeTextFilesData.pl -colmode collabel --columns MolWeight -o

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

225 -r NewSample1 Sample1.csv</div>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

226 To calculate all available statistics for data in third column and all column pairs,

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

227 and generate NewSample1DescriptiveStatisticsAll.csv, NewSample1CorrelationMatrix.csv,

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

228 NewSample1CorrelationMatrix.csv, and NewSample1MolWeightFrequencyAnalysis.csv files,

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

229 type:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

230 <div class="ExampleBox">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

231 % AnalyzeTextFilesData.pl -m DescriptiveStatisticsAll --columns 3 -o

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

232 --columnpairs AllPairs -r NewSample1 Sample1.csv</div>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

233 To compute frequency distribution of data in third column into five bins and

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

234 generate NewSample1MolWeightFrequencyAnalysis.csv, type:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

235 <div class="ExampleBox">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

236 % AnalyzeTextFilesData.pl -m Frequency --frequencybins 5 --columns 3

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

237 -o -r NewSample1 Sample1.csv</div>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

238 To compute frequency distribution of data in third column into specified bin range

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

239 values, and generate NewSample1MolWeightFrequencyAnalysis.csv, type:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

240 <div class="ExampleBox">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

241 % AnalyzeTextFilesData.pl -m Frequency --frequencybins "100,200,400"

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

242 --columns 3 -o -r NewSample1 Sample1.csv</div>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

243 To calculate all available statistics for data in all columns and column pairs, type:

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

244 <div class="ExampleBox">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

245 % AnalyzeTextFilesData.pl -m All --columns All --columnpairs

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

246 AllPairs -o -r NewSample1 Sample1.csv</div>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

247

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

248

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

249 <h2>AUTHOR</h2>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

250 <a href="mailto:msud@san.rr.com">Manish Sud</a>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

251

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

252

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

253 <h2>SEE ALSO</h2>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

254 <a href="./JoinTextFiles.html">JoinTextFiles.pl</a>,&nbsp<a href="./MergeTextFilesWithSD.html">MergeTextFilesWithSD.pl</a>,&nbsp<a href="./ModifyTextFilesFormat.html">ModifyTextFilesFormat.pl</a>,&nbsp<a href="./SplitTextFiles.html">SplitTextFiles.pl</a>,&nbsp<a href="./TextFilesToHTML.html">TextFilesToHTML.pl</a>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

255

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

256

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

257

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

258 <h2>COPYRIGHT</h2>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

260 This file is part of MayaChemTools.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

261 MayaChemTools is free software; you can redistribute it and/or modify it under

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

262 the terms of the GNU Lesser General Public License as published by the Free

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

263 Software Foundation; either version 3 of the License, or (at your option)

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

264 any later version.

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

265 &nbsp&nbsp<div class="DocNav">

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

266 <table width="100%" border=0 cellpadding=0 cellspacing=2>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

267 <tr align="left" valign="top"><td width="33%" align="left"><a href="./AnalyzeSequenceFilesData.html" title="AnalyzeSequenceFilesData.html">Previous</a>  <a href="./index.html" title="Table of Contents">TOC</a>  <a href="./AtomNeighborhoodsFingerprints.html" title="AtomNeighborhoodsFingerprints.html">Next</a></td><td width="34%" align="middle">March 29, 2015</td><td width="33%" align="right">AnalyzeTextFilesData.pl</td></tr>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

268 </table>

4816e4a8ae95 Uploaded

deepakjadmin

parents:

diff changeset

269 </div>

4816e4a8ae95 Uploaded

deepakjadmin