深圳市大数据研究院开放性数据集

LTE是一种4G无线通信技术,LTE网络由多个组成部分构成,包括手机终端(UE),基站(eNodeB)和核心网络(EPC)。UE是移动设备,如智能手机或平板电脑,负责与基站进行通信。基站负责管理和控制UE的接入、资源分配和数据传输。控制信道请求数据是手机与基站之间进行通信和协调的关键信息,对于网络性能优化和资源管理至关重要。控制信道信息可用于开发辐射源识别系统,可以自动识别并区分不同的辐射源。从控制信道数据中提取与辐射源指纹相关的特征。这些特征可以包括频谱特征、时域特征等。发射机是有指纹信息,如发射机的晶振、功放等造成发射的信息不同。使用机器学习或其他模式识别技术,对提取到的特征进行建模和训练。当有新的控制信道数据时,将其提取的特征输入到已经训练好的模型中,进行辐射源的识别和分类。

采集设备及信号调制

采集场景

室外盲采数据,包括移动、联通、电信手机的上行信号。移动是TDD模式,联通、电信是FDD模式。1个LTE信号采集设备(自己搭建),数据集包含了来自中国移动、中国联通和中国电信共计250个辐射源的控制信道数据。其中,中国移动有100个源,中国联通有100个源,中国电信有50个源。LTE信号采集设备如图1所示:

图1 LTE信号采集设备及其天线

数据格式

a)文件名



b)数据格式

信号采样率122.88MHz,实际信号的频率带宽范围是[17.7575MHz, 19.3775MHz]。数据帧格式是16比特双字节为一个值,8192个采样点为一个OFDM符号。如图2所示,数据采集每个子帧是1ms。

图2 无线帧

在每帧1ms的14个OFDM符号上,仅采集了一个OFDM符号(一个无线帧中随机一个时隙的参考符号)的完整信息,其余13个OFDM符号没有采集。每个子文件表示一个源的数据,文件用IMSI号命名,如图3所示。每个.dat文件的大小为几百KB,整个数据集的大小为6T。采集数据集为LTE信号采集设备与手机建立通信过程的控制信道数据,LTE信号采集设备主动找IMSI源并接收其发送的信号,不涉及业务数据。

图3 LTE信号采集设备采集的不同IMSI源的信号



c)数据读取方式

图4 采集数据的时频图

数据集应用和潜在价值

可用于开发辐射源识别系统,可以自动识别并区分不同的辐射源。从控制信道数据中提取与辐射源指纹相关的特征。这些特征可以包括频谱特征、时域特征等。发射机是有指纹信息,如发射机的晶振、功放等造成发射的信息不同。使用机器学习或其他模式识别技术,对提取到的特征进行建模和训练。当有新的控制信道数据时,将其提取的特征输入到已经训练好的模型中,进行辐射源的识别和分类。