【笔记】从技术的角度分析社交网络是如何刷粉刷量的
首先理清思路
分步骤:
- 多账号(多手机号)
- 防屏蔽(自动切换IP,智能运营)
- 用户操作(模拟操作)
前期准备
1. 多个手机号
现在注册网站必须要用手机号
2. 多个IP
社交网站都会有反垃圾措施,公用IP必然导致封号。
3. 模拟操作
因为我们的需求是个性化的,这一步我们可以封装一些基本操作,例如:关注,发布动态,转发,阅读文章等等。
手机号从哪来
当我们需要很多手机号的时候,怎么办?比如我们要1万个。
虚拟手机号:被歧视的号码段
虚拟手机号不限数量,不需要身份证绑定;但是社交网络里,虚拟号段被封的概率远远大于其他号段,比如170开头的。
阿里小号:看似可行的方案
阿里小号5元/月,有很多非170的号段,但是需要绑定身份证。
国外号码:贵但是价值明显
既不绑定身份证(即不限制数量),也不会被封。差不多5美元一个月。
一个手机号就相当于一个工人,你要让他的工作充实起来。
先从高价值的网站刷,然后在刷国内的APP。
如何自动切换IP
- IP代理
- 飞行模式
- 小区宽带
IP代理,所有人都想得到,但是并不靠谱。
- IP代理没有想象中的便宜。以不重复的100万IP为例,单日价格在2700元,相当于1万IP=27元。
- 免费IP比想象中好用。问题在于数量少。
所以量少的情况下,代理IP还是可以的,但是量大的情况下就太贵了。
飞行模式
手机断开网络之后再重连,IP就会发生变化。
WIFI和MIFI
MIFI其实就是Mobile WIFI的意思,你只需要一个MIFI设备和一张SIM卡。MIFI设备集成了路由器和调制解调器的功能。当我们断开MIFI设备重连的时候,就切换了IP。当让这个过程需要定制MIFI设备,也就是多一个网线接口,把数据传输出来,这样就可以自动进行控制了。
MIFI存在的问题
流量大的时候,SIM卡流量扛不住。
小区带宽
所以当流量大的时候,就可以考虑小区宽带。
需要控制交换机。
如何模拟操作
常用工具
- Selenium: 用于Web测试的工具,支持多浏览器和自动化测试。
- lxml:网页解析利器,支持HTML,XML,XPath解析,而且解析效率高。
- Scrapy:强大的爬虫框架,提升开发效率。
- PhantomJS:基于WebKit的无头浏览器,无头就是没有UI界面的意思。提供JavaScript接口,可以直接和WebKit交互。可以完成无界面的自动化测试,网页截图。
模块划分案例
自动化运营
微博
- 微博关注/取关
- 发微博
- 转发微博
- 爬取某个用户的粉丝列表
微信
- 阅读谋篇公众号文章
- 公众号关注/取关
- 爬取公众号的文章列表
- 抓取某篇文章的内容
内容库
- 按照关键词进行内容搜索
- 统计内容热度
- 广告识别(PR稿,购物引导都不要)
- 定时发布:例如每天发布一条内容。
- 定时转发:例如用其他微博转发该微博的内容,实现引流。
活动库
- 抽奖活动发布(明显相关)
- 爬取明星的粉丝/后援会列表
- 拼接明星粉丝列表,组成140个字
- 模拟水军参与抽奖,并@明星粉丝
结案报告
- 利用PhantomJS做发布,转发截屏
- 统计每天微信,微博用户量
- 数据可视化:自动生成日报,周报等列表