博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
异常检测(Anomaly detection): 异常检测算法(应用高斯分布)
阅读量:4677 次
发布时间:2019-06-09

本文共 664 字,大约阅读时间需要 2 分钟。

估计P(x)的分布--密度估计

我们有m个样本,每个样本有n个特征值,每个特征都分别服从不同的高斯分布,上图中的公式是在假设每个特征都独立的情况下,实际无论每个特征是否独立,这个公式的效果都不错。连乘的公式表达如上图所示。

估计p(x)的分布问题被称为密度估计问题(density estimation)

异常检测算法

 

1>找出一些能观察出异常行为的特征,尽可能尝试选择能够描述数据相关属性的特征。

2> 根据样本估计出参数的值,有n个特征每个特征都服从不同的正态分布,有不同的u和σ2,分别对这些u和σ2进行参数估计。

3> 检测新样本是否为异常值,需要计算出它的概率p(x),在上一步我们已经各个不同features的概率分布,通过联合概率来计算p(x),如果p(x)<ε,则它为异常值。

例子

我们根据我们的样本点(红色的点)估计出参数值(u1,u2,σ1,σ2)

对于给定的点,x(1)test和x(2)test计算它的p(x)=p(x1)*p(x2),给定ε为一个较小的值(0.02,对于ε如何取值将在后面讲到),判定p(x)是否小于ε来判断它是否为异常点。

从上图所示的三维图上来看,粉红色圈里面的点的高度(即p(x)的值)较外面的高,里面的点为正常点,外面的点为异常点。

总结

1>如何计算出p(x)来开发一种异常检测算法

2>通过给出的数据集进行参数估计,得到参数u和σ,然后检测新的样本,确定新样本是否异常,

转载于:https://www.cnblogs.com/yan2015/p/7392423.html

你可能感兴趣的文章
26.魔方阵问题
查看>>
封装、继承、多态
查看>>
iOS app开发资料整理
查看>>
python小练习-对序列分组2
查看>>
NYOJ243 - 交换输出
查看>>
mobx基础
查看>>
HTML-基础及一般标签
查看>>
华为手机打开Logcat的方法
查看>>
关闭Linux响铃、Fedora Core删除更新及安装过的文件
查看>>
SWMM[Storm Water Management Model]模型代码编译调试环境设置
查看>>
s11 day Linux 和nginx 部署
查看>>
程序猿的爱情-2012-01-22
查看>>
CentOS7.2 安装iptables
查看>>
网络是怎样连接的—1.浏览器生成消息
查看>>
codevs1430 素数判定
查看>>
2017年6月2号课堂笔记
查看>>
github
查看>>
poj1015【DP.......无奈了】
查看>>
C#性能优化的一些技巧
查看>>
PAT 甲级 1024 Palindromic Number
查看>>