2024年3月19日

Python: 开源多平台爬虫

仓库描述 https://github.com/NanmiCoder/MediaCrawler MediaCrawler-main.zip 小红书爬虫,抖音爬虫, 快手爬虫, B站爬虫, 微博爬虫...。 目前能抓取小红书、抖音、快手、B站、微博的视频、图片、评论、点赞、转发等信息。 原理:利用playwright搭桥,保留登录成功后的上下文浏览器环境,通过执行JS表达式获取一些加密参数 通过使用此方式,免去了复现核心加密JS代码,逆向难度大大降低 视频配置教程:MediaCrawler视频入门教程  功能列表 平台 Cookie 登录 二维码登录 指定创作者主页 关键词搜索 指定视频/帖子 ID 爬取 登录状态缓存 数据保存 IP 代理池 滑块验证码 小红书 ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✅ ✕ 抖音 ✅ ✅ ✕ ✅ ✅ ✅ ✅ ✅ ✅ 快手 ✅ ✅ ✕ ✅ ✅ ✅ ✅ ✅ ✕ B 站 ✅ ✅ ✕ ✅ ✅ ✅ ✅ ✅ ✕ 微博 ✅ ✅ ✕ ✅ ✅ ✅ ✅…
2024年3月13日

Python: Python中函数的定义以及调用先后顺序

一、解释型语言 解释型语言:程序不需要编译,程序在运行时才翻译成机器语言,每执 行一次都要翻译一次。因此效率比较低。 解释型语言是相对于编译型语言存在的,源代码不是直接翻译成机器语言,而是先翻译成中间代码,再由解释器对中间代码进行解释运行。比如 Python / JavaScript / Perl / Shell 等都是解释型语言。比如Basic语言,专门有一个解释器能够直接执行Basic程 序,每个语句都是执行的时候才翻译。(在运行程序的时候才翻译,专门有一个解释器去进行翻译,每个语句都是执行的时候才翻译。效率比较低,依赖解释器,跨平台性好.) 一个是编译,一个是解释。两种方式只是翻译的时间不同。编译型语言写的程序执行之前,需要一个专门的编译过程,把程序编译成为机器语言的文件,比如exe文件,以后要运行的话就不用重新翻译了,直接使用编…
2024年2月10日

Python: PyCharm tab代码补全会覆盖后面内容的解决办法

1. 问题概述: PyCharm tab代码补全会覆盖后面的内容。 比如:想在func()前加一个obj.,当输入ob提示可以自动补全为obj时,按tab,后面的func会被覆盖,变成obj()。 2. 相关原因: 因为Jetbrains系列和其他IDE对tab快捷键的定义不太一样,按tab会补全代码并覆盖后面的内容,enter则是补全代码不覆盖。 3. 解决办法: Windows 和 Linux下,通过菜单 File | Settings | Keymap 或快捷键 Ctrl+Alt+S 打开设置窗口,如下图: 可以看到tab快捷键为选择查询条目替换,enter为选择查询条目 为何是“选择查询条目替换”而不是“补全代码替换”,不得而知,但修改这两个按键映射确实解决了问题: 在“选择查询条目替换”上单击右键,然后选择“删除 Tab” 在“选择查询条目”上单击右…
2024年1月26日

Python: Python代码风格指南 中文版 Style Guide for Python Code Chinese Version

英文版:https://blog.norria.com/python-style_guide_for_python_code 目录 介绍 A Foolish Consistency is the Hobgoblin of Little Minds 代码布局 缩进 制表符或空格? 最大线长 二进制运算符之前或之后应该断线吗? 空白行 源文件编码 Imports 模块级别地下名称 字符串语录 表达式和语句中的空格 Pet Peeves  其他建议  何时使用尾随逗号  注释  块注释  内联评论 命名公约  要避免的名称  ASCII 兼容性  包装和模块名称  类名  类型变量名称  [异常名称]  [全局变量名称]  函数和变量名称  功能和方法参数  方法名称和实例变量  常量  继承设计 编程建议  功能注释 变量注解 参考 版权…
2024年1月23日

Django: 报错 OSError: No translation files found for default language zh-CN.

1. 问题概述: 在Django的settings.py中配置LANGUAGE_CODE = 'zh-CN'时,报错: OSError: No translation files found for default language zh-CN. 2. 相关原因: 目录(PycharmProject)/venv/lib/python3.10/site-packages/django/conf/locale/下为Django的语言文件。 其中,中文有简体中文zh-Hans和繁体中文zh-Hant。没有zh-CN的语言文件。 3. 解决办法: 将LANGUAGE_CODE设置为zh-Hans: LANGUAGE_CODE = 'zh-Hans'…