python爬取前程无忧招聘网站数据及可视化分析

项目描述

从前程无忧招聘网站上进行网页抓取，提取各项数据，数据包含多个维度，分别是城市、岗位名称、公司名字、公司规模、公司类型、经验要求、学历要求、专业要求、福利待遇和所属行业等。对爬取的数据进行数据清洗及标准化后，实现数据分析和可视化。最后实践apriori算法，进行频繁项集提取及关联分析。

运行环境

python3.7 PyCharm

项目技术(必填)

python爬虫和可视化技术

是否原创(转载必填原文地址)

是

项目截图(必填)

运行截图(必填)

python pi7.py

python pi11.py

python pi12.py

注意事项

Traceback (most recent call last):
  File "pi1.py", line 11, in <module>
    from pyecharts import Geo  #地理图
ImportError: cannot import name 'Geo' from 'pyecharts' (D:\Program Files (x86)\Python 3.8.1\lib\site-packages\pyecharts\__init__.py)

修改为

from pyecharts.charts import Geo  #地理图

最新抓取的解析方式有问题导致没法得到数据，请自行根据html dom格式解析

猜你喜欢

打赏

6个评论

4个牛币抓取网站数据 Python

文件名:python爬虫.zip,文件大小:3733.17K 下载