Python爬虫+数据分析:爬一爬懂车帝,分析一下现阶段哪款车值得我们去冲 - 知乎

admin 9 0

Python爬虫+数据分析:爬一爬懂车帝,分析一下现阶段哪款车值得我们去冲 - 知乎

  兄弟们,你们的热情让我都不敢断更了,冲!

  爬妹子什么的,虽然大家都很喜欢,但是也不能经常去爬对吧,身体重要,当然如果你们有什么好的网站,都可以推荐下,下次我爬完了给你们分享~

  网友:其实就是你自己想看吧

  兄弟们学习python,有时候不知道怎么学,从哪里开始学。掌握了基本的一些语法或者做了两个案例后,不知道下一步怎么走,不知道如何去学习更加高深的知识。

  那么对于这些大兄弟们,我准备了大量的免费视频教程,PDF电子书籍,以及视频源的源代码!

  还会有大佬解答!

  都在这个里了 Python学习资料免费领

  欢迎加入,一起讨论 一起学习!

  1、知识点requests 发送网络请求parsel 解析数据csv 保存数据

  2、使用的软件环境版本: python3.8编辑器版本:pycharm2021.2

  不会安装软件的看这里:Python入门合集 Python安装/环境配置/pycharm安装/基本操作/快捷键/永久使用都有

  3、第三方库requestsparsel

  这些是需要安装的第三方库,直接pip安装就好了。

  安装慢就使用镜像源安装

  镜像源有很多,我这里用的清华的。实在不会安装模块看我以前的文章:Python安装第三方模块及解决pip下载慢/安装报错找到 目标网址 https://www.dongchedi.com/usedcar/x-x-x-x-x-x-x-x-x-x-x-x-x-x-x-x-x-x-x?sh_city_name=%E5%85%A8%E5%9B%BD&page=1 a 确定我们要采集的目标 年份 品牌… b 确定数据来源 (静态页面True 和 动态页面)发送请求获取数据 html网页源代码解析数据 re css xpath bs4 …保存数据数据分析 简单的数据可视化 推荐功能 工具是不一样的 anaconda(python解释器) 里面的 jupyter notebook

  1、爬虫部分

  1.1 代码展示

  2、效果展示

  2.1 爬取中

  用pycharm打印出来有点乱码,它这个地方是有字体加密了,加密的部分就不显示,解密今天就先不分享了。

  2.2 保存的数据

  这是保存在Excel里面的数据,等下分析就分析这里面保存好的数据。

  3、数据分析部分

  3.1 导入模块

  pyecharts 没有的话需要安装一下

  3.2 Pandas数据处理

  3.21 读取数据

  3.22 查看表格数据描述

  df.describe()

  一共有10000条数据

  3.23 查看表格是否有数据缺失

  df.isnull().sum()

  3.3 Pyecharts可视化

  3.31 Pyecharts可视化

  可以看到成都的二手车数量是最多的,远超第二。

  3.32 各省市二手车平均价格柱状图

  不过价格的话,成都就比较平均,帝都遥遥领先。

  3.33 二手车品牌占比情况

  以宝马奥迪这几款车型来看,二手车品牌占比情况,宝马比奥迪胜出一筹。

  2.34 二手车里程区间

  基本上都是10公里以内的里程,还是非常有搞头的。看得我都想去冲两台了~

  3.4 二手车推荐

  哈哈 长沙居然没有奥迪 ,不给力啊

  4、数据分析代码运行

  数据分析代码的话,一般都是ipynb格式的,对于刚学数据分析的兄弟来说,就比较迷茫了,我简单分享下。

  首先打开我们存放代码的文件夹,然后在地址栏输入 jupyter notebook 然后按回车。

  如果你实在找不到代码存放的位置,右键点击代码打开属性。

  比如我是放在C:\Users\Administrator\Desktop 然后打开一个新的文件窗口,把这个地址粘贴进去按回车进入这个位置。

  继续前面讲的,我们按回车之后就会弹出这个窗口。

  找到你要运行的代码点进去就打开这个代码了

  运行都是一样的 点 run 就好了,运行之前你下载的数据一定要准备好,没数据怎么分析呢,对吧~

  兄弟们,文章看不会的话,我把视频教程放在评论区置顶了。

  • 评论列表

留言评论