博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
高维数据的重要属性
阅读量:5925 次
发布时间:2019-06-19

本文共 373 字,大约阅读时间需要 1 分钟。

高维数据的重要属性:

  • 数据集的大小随着维数呈指数级增长。
  • 在高维样本空间中,需要一个更大的数据才能把小部分的数据放入。
  • 在高维度空间中,几乎每一个点都比其他样本点更接近于某一边界。
  • 几乎每一个点都是异常点。

随着维数的增加,数据密度会越来越小,稀疏。如果样本没增加,只是增加维数,就会导致最终任意两个样本点的距离一样大。

理解:假如一个电信客户有短信功能,另外一个客户有通话功能,还有一个客户有上网功能。那么,如果把他们的记录都放在一个表,则会导致

第一个客户的通话和上网属性为0,第二个客户的短信和上网属性为0,第三个客户的短信和通话为0,这样计算这三个客户的距离就会变得很大。

 

做个小推广:程序员经常久坐,颈椎毛病比较多,特别推荐

转载于:https://www.cnblogs.com/longzhongren/p/4281895.html

你可能感兴趣的文章
怎样自己写一个MVC框架
查看>>
我的友情链接
查看>>
CIDR
查看>>
ELKstack-Elasticsearch各类安装部署方法
查看>>
重学数据结构004——栈的基本操作及实现(数组实现)
查看>>
java垃圾回收机制
查看>>
Windows Server 2012 DHCP 服务器中的新功能:故障转移和策略
查看>>
网规:第4章 网络安全-4.5IDS和IPS
查看>>
我的友情链接
查看>>
Java程序员应该知道的10个Eclipse调试技巧
查看>>
OpenSSL--Window生成证书实战
查看>>
利用 Node.js 实现 SAP Hana 数据库编程接口
查看>>
Loadrunner 接口测试方法
查看>>
系统学习redis之二——redis集群搭建
查看>>
手机自动化测试:appium源码分析之bootstrap七
查看>>
Linux:文件描述符
查看>>
c语言题中的一些陷阱
查看>>
c语言知识点(1)
查看>>
zuul转发的一些常见异常
查看>>
使用JUnitParams简化Parameterized tests
查看>>