云服务器网:购买云服务器和VPS必上的网站!

Ubuntu怎么实现词频统计

Ubuntu怎样实现词频统计Ubuntu实现词频统计的示例:使用shell实现简单的词频统计,例如:统计以下中第二列单词出现的次数。1,huabingood,1002,haha,2003,huabingood,3004,haha,1005,haha,200实现

ubuntu怎样实现词频统计

Ubuntu实现词频统计的示例:

使用shell实现简单的词频统计,例如:统计以下中第二列单词出现的次数。

1,huabingood,100

2,haha,200

3,huabingood,300

4,haha,100

5,haha,200

实现代码命令:

cat a.txt | awk -F "," '{print $2}' | sort | uniq -c | sort -nrk 1

代码解释:

awk -F “,” ‘{print $2}’ # 将数据依照逗号进行分割,并取出第二列的内容

sort  # 将取出的内容进行排序。由于uniq统计时,如果重复的数据不连续,就会被认为时两个区分内容的行

uniq -c  # 统计重复行出现的次数

sort -nrk 1  # 依照第一列重复的次数,依照数字顺序进行降序排列

本文来源:https://www.yuntue.com/post/75847.html | 云服务器网,转载请注明出处!

关于作者: yuntue

云服务器(www.yuntue.com)是一家专门做阿里云服务器代金券、腾讯云服务器优惠券的网站,这里你可以找到阿里云服务器腾讯云服务器等国内主流云服务器优惠价格,以及海外云服务器、vps主机等优惠信息,我们会为你提供性价比最高的云服务器和域名、数据库、CDN、免费邮箱等企业常用互联网资源。

为您推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注