仅作个人学习记录 jupyter 数据分析
(资料图片仅供参考)
对列表数据进行处理
ad_list = [{'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_职场新人_18-24_1-6', '广告计划ID': 'AD666', '优化目标': '直播间成交', '客单价': 88, '消耗': 2245, '直播间曝光数': 5893, '直播间观看数': 2298, '商品点击数': 1654, '商品下单数': 160, '商品成交数': 14, 'GMV': 123200, '成交金额': 123200, '投放日期': '2023-01-01'}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《商业分析课程》_数据分析-商业分析_22-35_1-6', '广告计划ID': 'AD888', '优化目标': '直播间成交', '客单价': 288, '消耗': 3231, '直播间曝光数': 3274, '直播间观看数': 1702, '商品点击数': 1174, '商品下单数': 102, '商品成交数': 10, 'GMV': 288000, '成交金额': 288000, '投放日期': '2023-01-01'}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《数据分析工具课程》_数据分析_22-35_1-6', '广告计划ID': 'AD999', '优化目标': '直播间成交', '客单价': 188, '消耗': 3784, '直播间曝光数': 5865, '直播间观看数': 4633, '商品点击数': 2779, '商品下单数': 200, '商品成交数': 27, 'GMV': 507600, '成交金额': 507600, '投放日期': '2023-01-01'}]
ad_list
1.取出数据,并赋值给一个变量
ad_1 = ad_list[0]
ad_1
2.处理重复的字段
del ad_1['成交金额']
ad_1
3.处理异常值
ad_1 ['GMV']=ad_1 ['GMV'] / 100
ad_1
4.增加字段(键)ROI 成交额/成本
ad_1['ROI'] = round(ad_1['GMV'] / ad_1['消耗'] , 2) #使用round函数是为了只保留2位小数
ad_1
5.广告策略分割
ad_1['广告计划名称'] .split('_')
ad_1['商品名称']=ad_1['广告计划名称'].split('_')[0]
ad_1['人群标签']= ad_1['广告计划名称'].split('_')[1]
ad_1['用户年龄']= ad_1['广告计划名称'].split('_')[2]
ad_1['用户等级']= ad_1['广告计划名称'].split('_')[3]
ad_1
对文件数据进行处理:将上述1-5步应用到文件中的每一个广告计划里
1.读取数据
with open('历史数据.txt','r',encoding='utf-8') as f:
history=()
history
2.读取出来的文本是字符串类型(引号),不可处理,要用eval函数去掉引号,变成可处理的
history=eval(history)
history
3.循环 分割广告策略
for i in range(len(history)):
ad_1=history[i]
del ad_1['成交金额']
ad_1['GMV']=ad_1['GMV']/100
ad_1['ROI']= round( ad_1['GMV'] / ad_1['消耗'],2)
ad_1['广告计划名称'].split('_')
ad_1['ad']=ad_1['广告计划名称'].split('_')[0]
ad_1['tag']=ad_1['广告计划名称'].split('_')[1]
ad_1['age']=ad_1['广告计划名称'].split('_')[2]
ad_1['level']=ad_1['广告计划名称'].split('_')[3]
history
5.提取roi大于1 的广告计划 if语句
good_list=[]
for i in range(len(history)):
if history[i]['ROI']>=1 :
good_(history[i])
else:
pass
good_list
使用函数,将上述步骤一步到位
def process_data(data_list):
ad_list=[]
for i in range(len(data_list)):
ad_1=data_list[i]
del ad_1['成交金额']
ad_1['GMV']=ad_1['GMV']/100
ad_1['ROI']= round( ad_1['GMV'] / ad_1['消耗'],2)
ad_1['广告计划名称'].split('_')
ad_1['ad']=ad_1['广告计划名称'].split('_')[0]
ad_1['tag']=ad_1['广告计划名称'].split('_')[1]
ad_1['age']=ad_1['广告计划名称'].split('_')[2]
ad_1['level']=ad_1['广告计划名称'].split('_')[3]
if ad_1['ROI']>=1:
ad_(ad_1)
else:
pass
return ad_list
with open('历史数据.txt','r',encoding='utf-8') as f:
history=()
history=eval(history)
history
process_data(history)
学习内容来自@戴戴戴师兄:BV1ZM4y1u7uF
下一篇:最后一页
同花顺财经讯华讯(00833 HK)8月30日发布公告,公司将于2023年10月26
马斯克“正上线1万个H100集群”,FSDV12训练速度有望年底提升,汽车,贴
截至8月31日上午,今年第9号台风“苏拉”继续向广东东部沿海靠近。受“
新华社北京8月30日电(记者周圆、王聿昊)记者30日从应急管理部获悉,
过去,“购物天堂”香港挤满了蜂拥而来的内地游客,如今两地间的人群却
2023款捷途X70作为8万元级别的中型SUV,其产品力在国产车市场算得上强
事关公积金!刚刚,缴纳人群有重大调整,缴存人,缴存基数,住房公积金,公
花开的时候,父母的爱蓓蔓绽放。像轻风拂过,他们温柔呵护。如同阳光灿
这个暑假,亲子研学游、家庭“搭伙”游成消费热点
首个一线城市官宣“认房不认贷”!8月30日,广州市人民政府办公厅发布
X 关闭
一季度厨房小家电再下滑 产品黏性需求需加强
市场增长点在哪儿?细分品类存在丰富的增量红利
劳模雷军还能“躺赢”吗?小米发布2022一季度财报净利腰斩
疫情下青海西宁“监管蓝”的“十二时辰”
小江豚搁浅长江岸滩 巡逻人员及时救援助其“回家”
青海西宁新增7例无症状感染者 累计报告阳性人员161例
X 关闭