博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
无监督算法
阅读量:5172 次
发布时间:2019-06-13

本文共 484 字,大约阅读时间需要 1 分钟。

无监督算法:

KMeans算法:

1、 随机初始化数据集簇的中心,一般从数据集中选择

2、 外循环:

内循环:计算各个数值点到中心的距离,进行聚类

        计算每个聚类的平局值,移动聚类中心

 

 

PCA算法:

目标:数据压缩和可视化

1、 对样本数据进行去均值和归一化

2、 组建sigma矩阵,然后进行奇异值分解,求的压缩和的结果Z

 

异常检测算法:

1、 选择可能适应于异常样本的特征

2、 根据样本得到高斯分布的均值和方差

3、 对给定的样本计算其是否为异常样本

 

 

异常检测与监督学习:

异常检测:正样本数量较少(0-20);大量的负样本

          不同类型的正样本,很难从正样本中学的算法将其识别出来

          未来会出现之前从未出现过的正样本,与当前的正样本无相似性

监督学习:有大量的正样本和负样本;

          足够的样本支撑可以从中学到正样本的特征的检测算法

          未来很难出现正样本中未出现过的样本

 

 

 

常见的异常检测和监督学习:

异常检测:欺诈行为/制造业/数据中心的监测

监督学习:垃圾邮件/天气/癌症

转载于:https://www.cnblogs.com/abella/p/10348320.html

你可能感兴趣的文章
如何防止Arp攻击
查看>>
ClassList 标签的用法
查看>>
小细节:Java中split()中的特殊分隔符 小数点
查看>>
【编程思想】【设计模式】【行为模式Behavioral】中介者模式Mediator
查看>>
后端接口时间戳或者随机数的作用
查看>>
tomcat docBase 和 path
查看>>
java默认语法、EL、JSTL表达式,JSTL和struts Tag标签的使用总结
查看>>
Vue笔记:使用 axios 发送请求
查看>>
富文本编辑器 - RichEditor
查看>>
java webcontroller访问时报415错误
查看>>
qcow2、raw、vmdk等镜像格式
查看>>
Jzoj5455【NOIP2017提高A组冲刺11.6】拆网线
查看>>
特定字符序列的判断(1028)
查看>>
华为面试
查看>>
平衡二叉树(AVL Tree)
查看>>
【BZOJ3295】[Cqoi2011]动态逆序对 cdq分治
查看>>
【CF799E】Aquarium decoration 线段树
查看>>
大运飞天 鲲鹏展翅
查看>>
从ECMA到W3C
查看>>
软件工程--第十六周学习进度
查看>>