博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Bhattacharyya距离
阅读量:5948 次
发布时间:2019-06-19

本文共 1563 字,大约阅读时间需要 5 分钟。

Bhattacharyya距离

在统计学中,Bhattacharyya距离(以下称巴氏距离)测量的是两个离散或连续概率分布的相似性。计算方式和Bhattacharyya系数关系很密切。两种计算方式都以A. Bhattacharyya名字命名,Bhattacharyya是一位30年代在印度统计研究所工作的统计学家。巴氏系数可用来对两组样本的相关性进行测量。这一方法常用来作分类器算法。[1]

 

数学定义

-离散概率分布

  对于在X数域上的两个离散概率分布p和q,巴氏距离定义为[2]:

 
  DB(p,q) = -ln(BC(p,q))
 
  其中
 
  BC(p,q) = ∑√p(x)q(x)
 
  BC被称作Bhattacharyya系数(巴氏系数)
 

  0≤BC≤1q且0≤DB≤∞

-连续概率分布

  在连续情形中,Bhattacharyya系数如下定义:

 
  BC(p,q) = ∫√p(x)q(x)dx
 
  0≤BC≤1q且0≤DB≤∞
 
  两种情形中,巴氏距离DB均不满足三角不等式
 

Bhattacharyya系数

  Bhattacharyya系数[3](Bhattacharyya Coefficient, 巴氏系数)是对两个统计样本的重叠量的近似计算。巴氏系数可用来对两组样本的相关性进行测量。

 
  计算巴氏系数涉及到对该两个样本的重叠部分进行基本形式的积分。两个样本值的积分被分成指定数目的部分。而每一个样本的每一个部分的成员数被用于下式中:
 
  Bhattacharyya = ∑{i=1|n}√(∑ai·∑bi)
 
  其中,a,b为两个样本,n是分块数,ai, bi分别是在a, b中第i部分的成员数。
 
  这样一来,这个式子就会随着因某块中有两个样本的公共成员而变大,也会随着某块中有一大片重叠的样本成员而变大。分块数的选定依赖于样本中的成员数量;如果分块太少会因过估了重叠区域而失去精确性,如果分块太多会因为造成空块而失去精确性。
 
  如果两个样本完全没有重叠,巴氏系数将会等于0,因为每一个分块都将被0乘。这意味着完全分离的样本不能被巴氏系数单独测定出来。
 
 
 
参考资料
1

维基百科

2

Bhattacharyya, A. (1943). "On a measure of divergence between two statistical populations defined by their probability distributions". Bulletin of the Calcutta Mathematical Society 35: 99–109. MR00103

3

维基百科

扩展阅读:
1

Kailath, T. (1967). "The Divergence and Bhattacharyya Distance Measures in Signal Selection". IEEE Transactions on Communication Technology 15 (1): 52–60. doi:10.1109/TCOM.1967.1089532.

2

H氏距离 

3

D. Comaniciu, V. Ramesh, P. Meer: Real-Time Tracking of Non-Rigid Objects using Mean Shift, BEST PAPER AWARD, IEEE Conf. Computer Vision and Pattern Recognition (CVPR'00), Hilton Head Island, South Carolina, Vol. 2, 142-149, 2000

4

一些属性列表,请查看: 

 

转自

转载地址:http://dafxx.baihongyu.com/

你可能感兴趣的文章
视频会议十大开源项目排行
查看>>
SQL Server Management Studio 简单使用说明
查看>>
【前端】javascript判断undefined、null、NaN;字符串包含等
查看>>
玩转iOS开发 - 数据缓存
查看>>
李洪强-C语言3-数组
查看>>
C# 6.0的字典(Dictionary)的语法
查看>>
使用ShareSDK实现第三方授权登录、分享以及获取用户资料效果,项目中包含:源码+效果图+项目结构图...
查看>>
三级联动效果
查看>>
Sprite和UI Image的区别
查看>>
ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/tmp/mysql/mysql.sock' (2)
查看>>
python练习笔记——丑数的计算
查看>>
OpenCV + python 实现人脸检测(基于照片和视频进行检测)
查看>>
XSS 前端防火墙 —— 天衣无缝的防护
查看>>
Node.js umei图片批量下载Node.js爬虫1.00
查看>>
客户端拖动控件封装(让拖动变得更简单)
查看>>
linux下IPTABLES配置详解
查看>>
Sharepoint学习笔记—习题系列--70-576习题解析 -(Q131-Q134)
查看>>
iOS边练边学--iOS中的(ARC下)单粒模式(GCD实现)
查看>>
php get_magic_quotes_gpc()函数用法介绍
查看>>
SQL to Java code for Elasticsearch
查看>>