加入收藏 | 设为首页 | 会员中心 | 我要投稿 惠州站长网 (https://www.0752zz.com.cn/)- 办公协同、云通信、物联设备、操作系统、高性能计算!
当前位置: 首页 > 教程 > 正文

用Python分析了数千个微信昵称后,我们发现了这些规律...

发布时间:2018-09-08 13:17:37 所属栏目:教程 来源:XksA
导读:副标题#e# 一、前言 这是一篇技术文,但又不是一篇技术文,今天分享的是,当笔者获取了微信小程序英文取名的3500多个微信用户昵称、年龄段后,分析得到下面结果。 二、Let's get it 1.基本信息获取 访问英文取名的用户基本信息接口,获取英文取名用户微信名

(3)数据分类判断

  1. # 昵称全中文判断 
  2. def is_all_ch(keyword): 
  3.     for c in keyword: 
  4.         # 包含常见中文字符 
  5.         if not ('u4e00' <= c <= 'u9fa5'): 
  6.             return False 
  7.     return True 
  8.  
  9. # 昵称全英文判断 
  10. def is_all_en(keyword): 
  11.     # 不能全部为空格或者首位为空格 
  12.     if all(ord(c) == 32 for c in keyword) or keyword[0] == ' ': 
  13.         return False 
  14.     # 允许空格和英文并存(例如:Xist A) 
  15.     if not all(65 < ord(c) < 128 or ord(c) == 32 for c in keyword): 
  16.         return False 
  17.     return True 
  18.  
  19. # 昵称全数字判断 
  20. def is_all_di(keyword): 
  21.     for uchar in keyword: 
  22.         if not (uchar >= 'u0030' and uchar <= u'u0039'): 
  23.             return False 
  24.     return True 
  25.  
  26. # 昵称包含表情图判断 
  27. def have_img(keyword): 
  28.     # 下面是大部分图片的一个unicode编码集 
  29.     # 详情查看:https://en.wikipedia.org/wiki/Emoji 
  30.     img_re = re.compile(u'[' 
  31.                       u'U0001F300-U0001F64F' 
  32.                       u'U0001F680-U0001F6FF' 
  33.                       u'u2600-u2B55]+', 
  34.                       re.UNICODE) 
  35.     if img_re.findall(keyword) : 
  36.         return True 
  37.     return False 
  38.  
  39. # 中文+数字昵称判断 
  40. def is_ch_di(keyword): 
  41.     for c in keyword: 
  42.         if not ('u4e00' <= c <= 'u9fa5') and not (c >= 'u0030' and c <= u'u0039'): 
  43.             return False 
  44.     return True 

(编辑:惠州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读