03 评论用户关注数分布

整体上符合常态,不过我也很好奇那些关注上千的用户,是什么样的一个存在。
可视化代码如下。
- def create_follows(df):
- """
- 生成评论用户关注数情况
- """
- df = df.drop_duplicates('id')
- follows = df['follows']
- bins = [0, 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 10000, 20000]
- level = ['0-10', '10-20', '20-50', '50-100', '100-200', '200-500', '500-1000', '1000-2000', '2000-5000', '5000-10000', '10000以上']
- len_stage = pd.cut(follows, bins=bins, labels=level).value_counts().sort_index()
- # 生成柱状图
- attr = len_stage.index
- v1 = len_stage.values
- bar = Bar("评论用户关注数分布情况", title_pos='center', title_top='18', width=800, height=400)
- bar.add("", attr, v1, is_stack=True, is_label_show=True, xaxis_interval=0, xaxis_rotate=30)
- bar.render("评论用户关注数分布情况.html")
04 评论用户粉丝数分布

这里发现粉丝数为「0-10」的用户不少,估摸着应该是水军在作怪了。
粉丝数为「50-100」的用户最多。
可视化代码如下。
- def create_follows(df):
- """
- 生成评论用户关注数情况
- """
- df = df.drop_duplicates('id')
- follows = df['follows']
- bins = [0, 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 10000, 20000]
- level = ['0-10', '10-20', '20-50', '50-100', '100-200', '200-500', '500-1000', '1000-2000', '2000-5000', '5000-10000', '10000以上']
- len_stage = pd.cut(follows, bins=bins, labels=level).value_counts().sort_index()
- # 生成柱状图
- attr = len_stage.index
- v1 = len_stage.values
- bar = Bar("评论用户关注数分布情况", title_pos='center', title_top='18', width=800, height=400)
- bar.add("", attr, v1, is_stack=True, is_label_show=True, xaxis_interval=0, xaxis_rotate=30)
- bar.render("评论用户关注数分布情况.html")
(编辑:惠州站长网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|