当前位置: 首页 > 服务 > 大数据营销 > 行业动态
山东大数据应用公司为你带来拓扑数据分析的三个要点
时间:2018.09.13 浏览:

  大家或许不太了解拓扑数据分析是什么?拓扑数据分析(TDA),顾名思义,就是把数据分析和拓扑学完美结合在一起的一种分析方法,它是用于深入研究大数据中潜藏的有价值的关系。山东大数据应用公司认为,相比于主成分分析、聚类分析这些常用的方法,TDA不仅可以有效地捕捉高维数据空间的拓扑信息,而且擅长发现一些用传统方法无法发现的小分类,这种方法也因此曾在基因与癌症研究领域大显身手。

  1.什么是拓扑数据分析

  拓扑学研究的是一些特殊的几何性质,这些性质在图形连续改变形状后还能继续保持不变,称为“拓扑性质”。而在复杂的高维数据内部也存在着类似的结构性质,我们可以形象地称之为数据的形状(特征)。

  2.拓扑数据分析的三个要点

  1)TDA的输入可以是一个距离矩阵,表示任意两数据点之间的距离。

  据山东大数据应用公司了解,它研究的是与坐标无关的形状,完全不受坐标的限制。这也意味着拓扑形状的构建依赖于距离函数的定义,或者说相似度概念的定义。坐标无关的特性,使得TDA可以整合来自不同平台的数据,尽管这些数据的结构不太一样,你只需要给出合理的距离函数。这是TDA的一个优点,通用性。

  2)TDA研究的数据形状,可以容忍数据小范围的变形与失真。

  山东大数据应用公司给你举个例子:想象在一块橡皮上写了一个字母”A”,你用力挤压拉扯这块橡皮,字母”A”虽然有点扭曲变形,但是“一个三角形带两个脚”这样的基本特征仍然存在。从上面“手”的例子也可以看出,TDA对小误差的容忍度很大。

  3)如果我们要粗略的描绘一个湖泊轮廓,最简洁的就是使用一个多边形。

  拓扑处理的是抽象的形状,最典型的例子就是用六边形来表示圆,这只需要用到6个点和6条边。

  TDA使用这种形式压缩数据,用有限的点和边来表示大量的数据,并且保留了数据重要的特征。

  山东大数据应用公司——亚宁传媒是一家互联网营销公司,2004年开始运营网络广告业务,2008年公司正式注册成立。十年弹指一挥间,发展至今,亚宁传媒已成为一家综合性的互联网营销公司,主要业务有:网站建设及优化、全网整合营销、网络广告、移动互联网营销、视频策划拍摄等,实现了三维立体、全网覆盖的网络营销效果。


关于亚宁 | 服务 | 案例 | 团队 | 动态 | 客户 | 联系 | 网站地图 | XML

  Copyright © 2019.YaNing All rights reserved. 备案号 : 鲁ICP备12015922号

18653128686
18653123386
返回顶部