nltktools: g_frequency.py comparison

planemo upload commit a81826fe44f09a3710a35c183aa88b745aeec064-dirty

comparison

equal deleted inserted replaced

-:e991d4e60c17
+:fb617586f4b2
 def frequency(in_file, out_file):
 """Input: a text file
 Output: a table of word frequency with three columns for Word, Count and Percent frequency
 """
-text = unicode(open(in_file, 'r').read(), errors='ignore')
+with open(in_file, 'r') as fd:
+text = fd.read()
 words = nltk.word_tokenize(text)
 frequency = FreqDist(words)
 total = float(frequency.N())
-output = open(out_file, 'w')
-output.write("Word\tCount\tPercent\n")
+with open(out_file, 'w') as output:
-for pair in frequency.items():
+output.write("Word\tCount\tPercent\n")
-output.write("{pair[0]}\t{pair[1]}\t{pc:.2f}\n".format(pair=pair, pc=100*pair[1]/total))
+for pair in frequency.items():
-output.close()
+output.write("{pair[0]}\t{pair[1]}\t{pc:.2f}\n".format(pair=pair, pc=100*pair[1]/total))
 if __name__ == '__main__':
 args = arguments()
 frequency(args.input, args.output)

Mercurial > repos > stevecassidy > nltktools