加入收藏 | 设为首页 | 会员中心 | 我要投稿 惠州站长网 (https://www.0752zz.com.cn/)- 办公协同、云通信、物联设备、操作系统、高性能计算!
当前位置: 首页 > 建站 > 正文

大势所趋!数据科学家必知的5种图算法

发布时间:2019-09-27 06:51:41 所属栏目:建站 来源:读芯术
导读:副标题#e# 在万物相连的世界里,用户并不是独立的个体,彼此之间都有某种联系。构建机器学习模型时,有时也会将这种联系放入模型中。 虽然关系数据库中无法在不同数行(用户)间使用这种关系,但在图数据库里,这样做非常简单。 本文将介绍一些数据科学家必知

现在另一个问题来了。假设你在水管铺设公司或互联网纤维公司工作,需要用最少的电线/管道连接图中的所有城市,这该怎么做呢?

大势所趋!数据科学家必知的5种图算法

一个无向图,它的MST在右边

应用

  • MST被直接应用于网络设计中。其中包括电脑网络、电讯网络、运输网络、供水网络和电网(最初设计目的)
  • MST还用于解决旅行商问题
  • 聚类——首先建构MST,接着用簇间距离和簇内距离确定阈值,从而打破MST中的一些联系
  • 图像分割——首先在图中构建MST,其中像素是节点,像素之间的距离基于一些相似性度量(颜色、强度等)

编码

  1. # nx.minimum_spanning_tree(g) returns a instance of type graph 
  2. nx.draw_networkx(nx.minimum_spanning_tree(g)) 
大势所趋!数据科学家必知的5种图算法

本图中的MST

如图所示,上图中便是要铺设的电线。

4. 网页排名

大势所趋!数据科学家必知的5种图算法

上图便是谷歌一直以来的网页排名算法。它根据输入和输出连接的数量和质量为页面分配分数。

应用

网页排名可用于需要估算网络节点重要性的任何地方。

  • 用于使用引文找到最有影响力的论文
  • 在谷歌中用于网页排名
  • 还可用来给推特排序——以用户和推特作为节点。如果用户A关注了用户B,就创建用户间的连接。如果用户发送或转发一条推特,则创建用户和推特之间的连接。
  • 推荐引擎

编码

此练习会使用Facebook数据。这里有facebook用户之间的连接/链接文件。首先这样创建Facebook图形:

  1. # reading the datasetfb = nx.read_edgelist('../input/facebook-combined.txt', create_using = nx.Graph(), nodetype = int) 

它是这样运作的:

  1. pos = nx.spring_layout(fb)import warnings 
  2. warnings.filterwarnings('ignore')plt.style.use('fivethirtyeight') 
  3. plt.rcParams['figure.figsize'] = (20, 15) 
  4. plt.axis('off') 
  5. nx.draw_networkx(fb, pos, with_labels = False, node_size = 35) 
  6. plt.show() 
大势所趋!数据科学家必知的5种图算法

FB用户图

现在要找到影响力高的用户。

(编辑:惠州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读