客户异常用电行为分析
成员
- 吴旭辉 2120161063
- 王帅 2120161056
- 庞荣 212061028
问题描述
1、问题背景分析
社会经济的发展使得社会用电量逐年增加,受利益驱使,窃电现象也日益严重。窃电行为不仅给供电企业造成了重大经济损失,也严重影响了正常的供用电秩序。根据国家电网公司统计,近年因窃电导致的损失达上千万元。近年来,窃电方式也由野蛮窃电发展到设备智能化、手段专业化、行为隐蔽化、实施规模化的高科技窃电,给反窃电工作进一步增加了很大的难度。随着电力系统升级,智能电力设备的普及,国家电网公司可以实时收集海量的用户用电行为数据、电力设备监测数据,因此,国家电网公司希望通过大数据分析技术,科学的开展防窃电监测分析,以提高反窃电工作效率,降低窃电行为分析的时间及成本。
2、问题描述:
(1) 选择数据集。本次的数据集是2016CCF大数据与计算智能大赛中提供的数据集。
(2) 数据预处理。包括对数据缺失值的处理以及重复项的去除。
(3) 特征提取。在本次的项目中将大体选择四类比较有代表性的特征,分别是周统计指标、月统计指标、季度用电量比值和总用电量特征。
(4) 模型训练。主要选择了逻辑回归、随机森林、gbdt和xgboost四种模型进行训练 评估标准则是利用map的方法。
目标
? ?本次数据挖掘的目标是可以实现根据用户一年的用电情况来预判该用户是否窃电。 s
项目分工
-王帅:数据清洗
-庞荣:数据特征提取
-吴旭辉:算法设计实现,数据训练及预测