0907python 数分 py基础知识

您当前的位置：首页 >> 商场 > >>

来源: 哔哩哔哩时间：2023-09-08 11:32:21

仅作个人学习记录 jupyter 数据分析

(资料图片仅供参考)

对列表数据进行处理

ad_list = [{'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_职场新人_18-24_1-6', '广告计划ID': 'AD666', '优化目标': '直播间成交', '客单价': 88, '消耗': 2245, '直播间曝光数': 5893, '直播间观看数': 2298, '商品点击数': 1654, '商品下单数': 160, '商品成交数': 14, 'GMV': 123200, '成交金额': 123200, '投放日期': '2023-01-01'}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《商业分析课程》_数据分析-商业分析_22-35_1-6', '广告计划ID': 'AD888', '优化目标': '直播间成交', '客单价': 288, '消耗': 3231, '直播间曝光数': 3274, '直播间观看数': 1702, '商品点击数': 1174, '商品下单数': 102, '商品成交数': 10, 'GMV': 288000, '成交金额': 288000, '投放日期': '2023-01-01'}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《数据分析工具课程》_数据分析_22-35_1-6', '广告计划ID': 'AD999', '优化目标': '直播间成交', '客单价': 188, '消耗': 3784, '直播间曝光数': 5865, '直播间观看数': 4633, '商品点击数': 2779, '商品下单数': 200, '商品成交数': 27, 'GMV': 507600, '成交金额': 507600, '投放日期': '2023-01-01'}]

ad_list

1.取出数据，并赋值给一个变量

ad_1 = ad_list[0]

ad_1

2.处理重复的字段

del ad_1['成交金额']

ad_1

3.处理异常值

ad_1 ['GMV']=ad_1 ['GMV'] / 100

ad_1

4.增加字段（键）ROI 成交额/成本

ad_1['ROI'] = round(ad_1['GMV'] / ad_1['消耗'] , 2) #使用round函数是为了只保留2位小数

ad_1

5.广告策略分割

ad_1['广告计划名称'] .split('_')

ad_1['商品名称']=ad_1['广告计划名称'].split('_')[0]

ad_1['人群标签']= ad_1['广告计划名称'].split('_')[1]

ad_1['用户年龄']= ad_1['广告计划名称'].split('_')[2]

ad_1['用户等级']= ad_1['广告计划名称'].split('_')[3]

ad_1

对文件数据进行处理：将上述1-5步应用到文件中的每一个广告计划里

1.读取数据

with open('历史数据.txt','r',encoding='utf-8') as f:

history=()

history

2.读取出来的文本是字符串类型（引号），不可处理，要用eval函数去掉引号，变成可处理的

history=eval(history)

history

3.循环分割广告策略

for i in range(len(history)):

ad_1=history[i]

del ad_1['成交金额']

ad_1['GMV']=ad_1['GMV']/100

ad_1['ROI']= round( ad_1['GMV'] / ad_1['消耗'],2)

ad_1['广告计划名称'].split('_')

ad_1['ad']=ad_1['广告计划名称'].split('_')[0]

ad_1['tag']=ad_1['广告计划名称'].split('_')[1]

ad_1['age']=ad_1['广告计划名称'].split('_')[2]

ad_1['level']=ad_1['广告计划名称'].split('_')[3]

history

5.提取roi大于1 的广告计划 if语句

good_list=[]

for i in range(len(history)):

if history[i]['ROI']>=1 :

good_(history[i])

else:

pass

good_list

使用函数，将上述步骤一步到位

def process_data(data_list):

ad_list=[]

for i in range(len(data_list)):

ad_1=data_list[i]

del ad_1['成交金额']

ad_1['GMV']=ad_1['GMV']/100

ad_1['ROI']= round( ad_1['GMV'] / ad_1['消耗'],2)

ad_1['广告计划名称'].split('_')

ad_1['ad']=ad_1['广告计划名称'].split('_')[0]

ad_1['tag']=ad_1['广告计划名称'].split('_')[1]

ad_1['age']=ad_1['广告计划名称'].split('_')[2]

ad_1['level']=ad_1['广告计划名称'].split('_')[3]

if ad_1['ROI']>=1:

ad_(ad_1)

else:

pass

return ad_list

with open('历史数据.txt','r',encoding='utf-8') as f:

history=()

history=eval(history)

history

process_data(history)

学习内容来自@戴戴戴师兄：BV1ZM4y1u7uF

标签：

上一篇：减速器概念震荡反弹威力传动涨、光洋股份涨停

下一篇：最后一页

为您推荐

华讯公布2023财年中期权益分配方案

同花顺财经讯华讯（00833 HK）8月30日发布公告，公司将于2023年10月26

来源：同花顺金融研究中心时间：2023-08-31
马斯克“正上线1万个H100集群”，FSD V12训练速度有望年底提升

马斯克“正上线1万个H100集群”，FSDV12训练速度有望年底提升,汽车,贴

来源：IT之家时间：2023-08-31
“苏拉”登陆后还会回旋出海？该怎样防御？气象专家解读

截至8月31日上午，今年第9号台风“苏拉”继续向广东东部沿海靠近。受“

来源：羊城派时间：2023-08-31
国家防总针对6省份启动防汛防台风四级应急响应

新华社北京8月30日电（记者周圆、王聿昊）记者30日从应急管理部获悉，

来源：新华网时间：2023-08-31
一个暑假跑了900万次，香港人“挤爆”深圳！深圳本地人大受震撼：“差点以为我到了香港”

过去，“购物天堂”香港挤满了蜂拥而来的内地游客，如今两地间的人群却

来源：每日经济新闻时间：2023-08-31
提供5/7座两种版本，新款捷途X70——更适合全家出行的车

2023款捷途X70作为8万元级别的中型SUV，其产品力在国产车市场算得上强

来源：海车汇时间：2023-08-31
事关公积金！刚刚，缴纳人群有重大调整

事关公积金！刚刚，缴纳人群有重大调整,缴存人,缴存基数,住房公积金,公

来源：创作者_PWFD 时间：2023-08-31
形容父母对孩子的爱的诗句

花开的时候，父母的爱蓓蔓绽放。像轻风拂过，他们温柔呵护。如同阳光灿

来源：伊秀经验网时间：2023-08-31
这个暑假，亲子研学游、家庭“搭伙”游成消费热点

这个暑假，亲子研学游、家庭“搭伙”游成消费热点

来源：成都商报时间：2023-08-31
广州官宣认房不认贷！深圳多家银行表示暂未收到通知

首个一线城市官宣“认房不认贷”！8月30日，广州市人民政府办公厅发布

来源：每日经济新闻时间：2023-08-31