本次小F就给大家介绍一下如何用Python制作一个数据可视化网页,使用到的是Streamlit库。
轻松的将一个Excel数据文件转换为一个Web页面,提供给所有人在线查看。
每当你对Excel文件进行更改保存,Web页面还能够实时进行更新,确实挺不错的。

Streamlit的文档和教程地址如下。
https://docs.streamlit.io/en/stable/
https://streamlit.io/gallery
相关的API使用可以去文档中查看,都有详细的解释。
项目一共有三个文件,程序、图片、Excel表格数据。
数据情况如下,某公司年底问卷调查(虚构数据),各相关部门对生产部门在工作协作上的打分情况。
有效数据总计约676条,匿名问卷,包含问卷填写人所属部门,年龄,评分。
最后对各部门参与人数进行汇总计数(右侧数据)。
首先来安装一下相关的Python库,使用百度源。
#安装streamlitpipinstallstreamlit-ihttps://mirror.baidu.com/pypi/simple/#安装PlotlyExpresspipinstallplotly_express==0.4.0-ihttps://mirror.baidu.com/pypi/simple/#安装xlrdpipinstallxlrd==1.2.0-ihttps://mirror.baidu.com/pypi/simple/
因为我们的数据文件是xlsx格式,最新版的xlrd,只支持xls文件。
所以需要指定xlrd版本为1.2.0,这样pandas才能成功读取数据。
命令行终端启动网页。
#命令行终端打开文件所在路径cdExcel_Webapp#运行网页streamlitrunapp.py
成功以后会有提示,并且浏览器会自动弹出网页。
如果没有自动弹出,可以直接访问上图中的地址。
得到结果如下,一个数据可视化网页出来了。
目前只能在本地访问查看,如果你想放在网上,可以通过服务器部署,需要自行去研究~
下面我们来看看具体的代码吧。
importpandasaspdimportstreamlitasstimportplotly.expressaspxfromPILimportImage#设置网页名称st.set_page_config(page_title='调查结果')#设置网页标题st.header('2020年调查问卷')#设置网页子标题st.subheader('2020年各部门对生产部的评分情况')
导入相关的Python包,pandas处理数据,streamlit用来生成网页,plotly.express则是生成图表,PIL读取图片。
设置了网页名称,以及网页里的标题和子标题。
#读取数据excel_file='各部门对生产部的评分情况.xlsx'sheet_name='DATA'df=pd.read_excel(excel_file,sheet_name=sheet_name,usecols='B:D',header=3)#此处为各部门参加问卷调查人数df_participants=pd.read_excel(excel_file,sheet_name=sheet_name,usecols='F:G',header=3)df_participants.dropna(inplace=True)#streamlit的多重选择(选项数据)department=df['部门'].unique().tolist()#streamlit的滑动条(年龄数据)ages=df['年龄'].unique().tolist()
读取Excel表格数据,并且得出年龄分布以及部门情况,一共是有5个部门。
添加滑动条和多重选择的数据选项。
#滑动条,最大值、最小值、区间值age_selection=st.slider('年龄:',min_value=min(ages),max_value=max(ages),value=(min(ages),max(ages)))#多重选择,默认全选department_selection=st.multiselect('部门:',department,default=department)
结果如下。
年龄是从23至65,部门则是市场、物流、采购、销售、财务这几个。
由于滑动条和多重选择是可变的,需要根据过滤条件得出最终数据。
#根据选择过滤数据mask=(df['年龄'].between(age_selection))&(df['部门'].isin(department_selection))number_of_result=df[mask].shape[0]#根据筛选条件,得到有效数据st.markdown(f'有效数据:{number_of_result}')#根据选择分组数据df_grouped=df[mask].groupby(by=['评分']).count()[['年龄']]df_grouped=df_grouped.rename(columns={'年龄':'计数'})df_grouped=df_grouped.reset_index()
得到数据便可以绘制柱状图了。
#绘制柱状图,配置相关参数bar_chart=px.bar(df_grouped,x='评分',y='计数',text='计数',color_discrete_sequence=['#F63366']len(df_grouped),template='plotly_white')st.plotly_chart(bar_chart)
使用plotly绘制柱状图。
当我们在网页调整选项时,有效数据和柱状图也会随之变化。
此外streamlit还可以给网页添加图片和交互式表格。
#添加图片和交互式表格col1,col2=st.beta_columns(2)image=Image.open('survey.jpg')col1.image(image,caption='Designedby小F/法纳斯特',use_column_width=True)col2.dataframe(df[mask],width=300)
得到结果如下。
可以看到表格有一个滑动条,可以使用鼠标滚轮滚动查看。
最后便是绘制一个饼图啦!
#绘制饼图pie_chart=px.pie(df_participants,title='总的参加人数',values='人数',names='公司部门')st.plotly_chart(pie_chart)
结果如下。
各部门参加问卷调查的人数,也是一个可以交互的图表。
将销售、市场、物流取消掉,我们就能看出财务和采购参加问卷调查的人数占比情况。
好了,本期的分享就到此结束了,有兴趣的小伙伴可以自行去实践学习。
最后本次使用到的代码和数据已上传,欢迎大家点赞、收藏、学习!
!
!