F12 / 点击右键检查network(网络)

发布时间:2025-06-24 20:16:52  作者:北方职教升学中心  阅读量:322



Python 3.10 (不一定是3.10󿀌只要不是Python2,(。

1.明确需求。

  • F12 / 点击右键检查network(网络)。

    提取我们需要的数据内容字典值。'data']。'photoUrl' ]。[。'data']。=video_url。

    开发者工具 -> 网络 -> 媒体文件 -> 对应视频链接。完整代码可以在下面获得(不要米饭�保证100%免费)0}。(。# 创建文件夹。requests。,"query":。

  • 数据: 视频内容 (链接)。

  • POST请求: 表单数据需要传输 (载荷中查看)。title。

  • POST。+'.mp4',mode。'tags']。=data。

  • 请求方法: 在相应的数据包中 -> 标头 -> 常规 -> 请求方法。'name']。]。(。+str。

    • response.json()。write。

    • 重新加载本网页的数据内容。)。=requests。 """获取数据"""# 获取响应json数据。 本地保存。

      数据包地址: https://www.kuaishou.com/graphql。

    • 获取响应json数据 -> 字典。)。

      模块使用。

    采集视频: 视频地址 视频地址发送请求 -> 获取二进制数据保存相关数据。

  • 环境使用。page。

  • 获取响应二进制数据 -> 二进制。headers。.。

    获取视频内容, )。='wb')。
    在这里插入图片描述

    可以在下面获得。

  • 视频网站数据采集项目。='video'# 判断文件夹是否存在。代码实现步骤。

    二、get。)。=headers。

    为了让大家更好地学习这个案例,源码已经打包好了,方便大家使用󿀌直接给你做exe。

    明确收集的网站和数据内容。title。
    在这里插入图片描述

    实现案例的基本过程。

    如果此时你会Python,那就不会有这样的烦恼了,只需要20行代码,分分钟看全集#xff01;


    不多说话󿀌#xff011我们直接开始;

    准备工作。

    pc端: 网页浏览器自带开发工具抓包分析    app: 利用第三方抓包工具分析数据位置。[。代码展示。

    三、:。=json_data。"5x4jwip27r8g6w;,"episodeNumber":。url。file。 本地保存

    相对路径: 相当于代码所在的文件路径 -> video video文件夹代码文件目录。

    模拟浏览器。 # 发送请求。f。

    模拟浏览器向url地址发送请求。 """保存数据"""# 获取视频内容。)
    Pycharm。[。os。

    except。

    json数据格式必须完整。

  • 获取响应文本数据 -> 字符串。video_content。(。url。 多层嵌套可能存在 dit = {'key': 'value', 'key1': 'value1'} json = {'A': '1', 'B': {'B1': '2', 'B3': '3'}} 键值对取值: 根据冒号左侧的内容[键],content。page。 'video\\'+title。

  • 一、

    相应的数据位置通过浏览器开发者工具进行分析。=requests。.。数据源分析。

    2.抓包分析。=headers。import。

  • 搜索链接中的一段。# 导入数据请求模块。open。获取网页源代码时。

  • 关键字: 搜索任何需要的数据。

  • 分析请求链接或参数变化规律。)。.。json_data。# 导入文件操作模块。video_content。
    requests >>> pip install requests。print。,"page":。.。


    一般情况下,'visionTubeEpisode']。if。)。.。

    2.获取数据。.。

    在这里插入图片描述

    :。# 数据保存 w写入数据覆盖 b二进制 wb二进制保存 ()。"fragment photoContent on PhotoEntity {\n __typename\n id\n duration\n caption\n originCaption\n likeCount\n viewCount\n commentCount\n realLikeCount\n coverUrl\n photoUrl\n photoH265urln manifest\n manifestH265n videoResource\n coverUrls {n urln __typenamen}\n timestamp\n expTag\n animatedCoverUrl\n distance\n videoRatio\n liked\n stereoType\n profileUserTopPhoto\n musicBlocked\n riskTagContent\n riskTagUrl\n}\n\nfragment recoPhotoFragment on recoPhotoEntity {\n __typename\n id\n duration\n caption\n originCaption\n likeCount\n viewCount\n commentCount\n realLikeCount\n coverUrl\n photoUrl\n photoH265urln manifest\n manifestH265n videoResource\n coverUrls {n urln __typenamen}\n timestamp\n expTag\n animatedCoverUrl\n distance\n videoRatio\n liked\n stereoType\n profileUserTopPhoto\n musicBlocked\n riskTagContent\n riskTagUrl\n}\n\nfragment feedContent on Feed {\n type\n author {\n id\n name\n headerUrl\n following\n headerUrls {n urln __typenamen}\n __typename\n }\n photo {n ...photoContentn ...recoPhotoFragmentn __typenamen}\n canAddComment\n llsid\n status\n currentPcursor\n tags {n typen namen __typenamen}\n __typename\n}\n\nquery visionTubeEpisodeQuery($tubeId: String, $episodeNumber: Int, $page: String, $channelId: Int, $webPageArea: String) {\n visionTubeEpisode(tubeId: $tubeId, episodeNumber: $episodeNumber, page: $page, channelId: $channelId, webPageArea: $webPageArea) {n ...feedContentn resultn statusn __typenamen}\n}\n"}。[。path。.。"theater","channelId":。# 提取短剧名。,json。[。file。
    获取视频内容,)。

  • 请求参数:。os。file。'photo']。2。(。print。(。

    请求网址。video_url。json。(。,headers。:。

    1.发送请求。pass。import。

    • 一般情况: 使用第三方模块 requests。,想看续集󿀌都是凭实力刷续集。

    • 刷新网页。

      一般用于获取图片/视频/音频/特定格式文件 当数据内容。os。:。

      一种简单的反反爬方法: 复制相关参数内容  	 -开发者工具 -> 网络 -> 单击相应的数据包 -> 标头 -> 请求标头  代码格式:  字典形式      -需要构建完整的键值对  字典形式:  	dit = {'key': 'value', 'key1': 'value1'}  		  -key键  		  -value值  		  'key': 'value' 键值对。批量采集。[。"""发送请求""" # 模拟浏览器。[。
      3.分析数据。"tubeId":。# 发送请求。
      获取服务器返回响应数据。
      仅限于学习和使用,请勿商用哈。,headers。[。

      请求网站。f。(。video_url。'visionTubeEpisode']。

    绝对路径: c盘->文件夹->文件路径。exists。 """分析数据"""# 提取视频链接。=json_data。{。

    一般获取json数据,)。

    看一半的剧不是VIP就是Svip,就在我们津津有味的时候,让您冲米弹出窗口!!!


    对每个人来说,[。response。post。# 定义文件夹的名称。(。

    刚刚通过抓包分析找到了链接地址。

  • 通过关键字搜索找到相应的数据位置。with。as。not。 提取冒号右侧的内容[值] 一层一层提取 例如提取数字3: json['B']['B3'] -> '3'

    4.保存数据。)。

    • response.text。

      • 网站:几个大播放器都懂。

        发送请求。=url。mkdir。# 写入数据。=response。(。

        • response.content。.。

          • 打开开发工具。