WiFi探针基础原理

点击打开微信,马上办理ETC

 

文章目录:

什么是mac地址?

什么是wifi 探针技术?

探针采集的数据包含哪些内容?

什么是随机MAC?

 

 

什么是mac地址?

MAC(Medium/Media Access Control)地址,用来表示互联网上每一个站点的标识符,采⽤ ⼗六进制数表示,共六个字节(48位)。其中,前三个字节是由IEEE的注册管理理机构RA负责给不同⼚家分配的代码(高位24位),也称为“编制上唯一的标识符”(Organizationally Unique Identifier),后三个字节(低位24位)由各厂家⾃行指派给生产的适配器接⼝,称为扩展标识符(唯一性)。一个地址块可以⽣成224个不同的地址。MAC地址实际上就是适配器地址或适配器标识符EUI-48。

MAC(Media Access Control,介质访问控制)地址,也叫硬件地址,长度是48⽐特(6字节),由16进制的数字组成,分为前24位和后24位:前24位叫做组织唯⼀标志符(Organizationally Unique Identifier,即OUI),是由IEEE的注册管理机构给不同⼚家分配的代码,区分了不同的⼚家。后24位是由厂家⾃己分配的,称为扩展标识符。同⼀个⼚家⽣产的⽹卡中MAC地址后24位是不同的。

图1.1 Mac地址报⽂文格式

 

MAC地址对应于OSI(Open System Interconnect开放系统互连)参考模型的第二层数据链路层,工作在数据链路层的交换机维护着计算机MAC地址和自身端⼝的数据库,交换机根据收到的数据帧中的“⽬的MAC地址”字段来转发数据帧。

图1.2 OSI⽹网络七层模型

 

图1.3 iOS 设备

 

安卓设备的mac地址示例

 

网卡的物理地址通常是由网卡生产⼚家烧⼊网卡的EPROM(⼀种闪存芯⽚片,通常可以通过程序擦写),它存储的是传输数据时真正赖以标识发出数据的电脑和接收数据的主机的地址。也就是说,在网络底层的物理传输过程中,是通过物理地址来识别主机的,它一定是全球唯一的。比如,著名的以太网卡,其物理理地址是48bit(⽐比特位)的整数,如:44-45- 53-54-00-00,以机器可读的方式存⼊主机接⼝中。以太⽹地址管理机构(除了管这个外还管别的)(IEEE)(IEEE:电⽓气和电⼦子⼯工程师协会)将以太⽹地址,也就是48⽐比特的不同组合, 分为若⼲干独⽴的连续地址组,生产以太⽹网卡的⼚厂家就购买其中一组,具体生产时,逐个将唯一地址赋予以太⽹网卡。形象地说,MAC地址就如同我们身份证上的身份证号码,具有全球唯⼀一性。

 

 

什么是Wi-Fi探针技术?

狭义上来说,WiFi探针特指WiFi设备通信过程中的一种信号帧,即Probe Request,这种类型的报文专门用来请求终端(笔记本、智能手机等能够连接WiFi网络的设备)周围的WiFi信号,然后由放出WiFi信号的设备如⽆线路由器、无线AP等设备⽤用Probe Response报文给予回复。因为探针报⽂中会携带终端的WiFi芯片mac地址,以及交互时间等信息,因此 在现在的商业场景中,WiFi探针技术⼤多被用来记录顾客在商业环境(如商场、超市等)中的行为轨迹,而由于不不论Probe Request还是Probe Response都发生在顾客的智能终端打开WiFi开关但尚未连接上WiFi网络之前,也就是说处在正常的网络应用(如QQ和微信等)的传输都还没有开始的阶段,因此WiFi探针技术并不不能抓取到用户上网的内容亦或是⼿机内的隐私内容,仅仅只能通过智能终端的移动轨迹和停留时⻓等信息来分析该用户在商业环境的行为,同时也说明,没有打开WiFi开关的智能设备是没有办法被探针设备捕捉到的。目前,WiFi探针技术被较为广泛地应⽤在客流统计与分析以及精准营销等方⾯。

图1.4 Wi-Fi探针设备工作原理

 

 

探针采集的数据包含哪些内容?

不同的厂商采集的内容不同,根据手机不同的状态能采集到的内容也不尽相同,但都会包含如下几部分内容:探针mac地址、探测时间、探针抓到的智能终端的mac地址、智能终端的信号强度(⽤用RSSI表示),如下图:

图1.5 探针设备采集信息示意图

 

 

什么是随机MAC?

苹果公司在IOS8中引⼊的随机mac特性以后,谷歌和微软也相继在⾃己的最新手机操作系统中推出了mac地址随机的算法。随着新版操作系统市场占有率的逐步提  高,基于mac地址的大数据分析业受到的影响也越来越明显。从芝麻科技数据平台统计的随机mac情况来看,在IOS8推出随机mac特性之前,数据平台上抓到的真实mac占比在95%以上。而在IOS8发布后,这一指标迅速下降,目前基本稳定在39%左右,其余61%左右的mac地址几乎全为随机化的mac地址。如下图,随机mac均为Local属性,其Universal/Local Bit 会置位为1。

 

 

苹果 -苹果从iOS8开始引入在Probereq包中使用随机mac的特性,起初仅在黑屏情况下使用随机 mac,IOS9开始在亮屏状态下也使用随机mac。目前IOS8以上的苹果设备已经超过全部苹果设备的 80%,苹果手机是随机mac最主要的来源。从芝麻科技数据平台的数据来看, 每天抓取到的全部真实mac地址中, 有14%左右为苹果⼿机的mac地址。

安卓-安卓从6.0版本开始,在硬件和驱动⽀持的⼿机上使⽤随机mac进⾏背景搜索。但由于安卓版本碎化严重,6.0版本发布至今已经⼀年多,占有率仅有20%左右。2016年年发布的7.0版本在随机mac 功能上没有变化。

windows -微软从Windows10开始引入mac地址的随机化功能,开启该功能同样需要 硬件和驱动支持。与其他系统不同的是,windows10不仅在Probereq包中使用随机mac,其在连接不同的网络时使用的也是不同的mac地址。对同一个无线⽹络来说,它使⽤用的mac地址是固定的,但对于不不同的无线⽹络来说,它使⽤用的是不同的mac地址。mac地址的算法如下:

addr = SHA-256(SSID , macaddr , connId , secret )

其中,ssid是⽆线网络的名称,macaddr是⼿机的真实mac地址,connid在手机第⼀次连接该 ssid时⽣生成,当该ssid被从手机的ssid列表中删除并重新添加时会改变。secret是手机初始化时随机⽣生成的。

综上所述,Windows10的mac地址随机化算法更有效的避免了真实mac地址的泄露,

但是由于windows phone的市占有率还不⾼高,所以其对数据分析业务影响暂时较⼩小,安卓设备的碎⽚化程度严重,经过测试目前国内主流的华为、三星、OPPO、VIVO和⼩米均没有采用mac地址随机化的⽅式,因此目前来看,随机mac量最大的还是iOS设备。这就使得⼀些客户在了解到有随机mac的存在以后产生了一定的困惑,是不是iPhone在没连WiFi的时候 就一直发随机mac⽽完全不不发真实mac了了呢?这会不会导致iPhone的mac就完全抓不不到了呢?其实在真实的场景中,iOS设备也并不不是⼀一直都发随机mac的,如果某个携带iOS设备 的顾客路路过某个之前连接过的WiFi信号(⽐如主流⼀二线城市⾥里比较主流的WiFi信号:CMCC、ChinaNet、Starbucks等),他的⼿机会尝试与这些信号进⾏连接,在这个过程中 使⽤的就是真实mac。而如果此时附近有探针设备,就可以抓到这位顾客的iOS设备的真实mac地址了。再加上现在有些探针设备的厂家会内置⼀一些诱导算法,也会增加真实的iOS 备mac地址的抓取⼏几率,因此整体上来说,随机mac的出现大约使得iOS设备的抓取率下了了50%⽽而并不不是完全抓取不不到。

 

点击打开微信,马上办理ETC


意见反馈

发表评论