工具向——用python做一个简易的微博助手

如果你有想要特别关注的微博账号,但是又没有装手机微博(或者说关闭了微博的垃圾消息提醒)又不是很喜欢刷微博的人,想要第一时间获取关心的微博消息怎么办呢。
或许你可以试试这样,利用爬虫每隔一小段时间间隔就重新获取一次关注账号的微博,比对是否有新消息,如果有则发送到你的微信账号上,当然也可以发送到你的邮箱,不过微信更及时更友好点。
这个想法最早在一个python课程(很抱歉记不得是哪个课程了,记忆力太差。。)里看到,这里简单实现下。
爬虫部分利用requests库和BeautifulSoup库很容易完成爬取和解析。实现时间间隔就用最简单的睡眠(time.sleep)。发送到微信使用itchat库发送到自己的文件助手就好了,很简单。
当然电脑端同一微信账号登录只能有一个,也就是不能同时使用该账号的电脑版微信了,解决方案是采用登录微信小号发送给大号的形式,这样消息提醒也更明确,不容易忽略。
这里打包好的可执行程序只是发送文件助手的方案。
链接:http://pan.baidu.com/s/1kVvCpvh 密码:cxza
代码github

效果图,以segmentfault微博账号为例

工具向——用python做一个简易的微博助手_第1张图片

使用方法

工具向——用python做一个简易的微博助手_第2张图片
输入你的cookie和要获取的微博账号uid
工具向——用python做一个简易的微博助手_第3张图片
在对弹出的二维码微信扫码登录后就可以接收到消息了

获取你的微博账户cookie

工具向——用python做一个简易的微博助手_第4张图片

获取用户uid

找到用户的uid 如 segmentfault 为 2036070420

代码

# 使用pyinstaller 一键生成可执行文件 位于dist目录下
# pyinstaller weibohelper.py --onefile
from bs4 import BeautifulSoup
import time
import requests
from requests.packages.urllib3.exceptions import InsecureRequestWarning
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)

print('请输入cookie:')
cookie = input()

print('请输入uid:')
uid = input()
uids = (uid, )

headers = {
    "Cookies": cookie,
    "User-Agent":'Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1'
}
r = requests.session()
r.headers.update(headers)

# 获取某条微博的评论
def get_comments_from_one_weibo(id):
    try:
        json = r.get(
            ('https://m.weibo.cn/api/comments/show?'
             'id={0}&page=1').format(id),
            verify=False,
        ).json()
        if json['ok'] == 1:
            comments = []
            for c in json['data']:
                comments.append(BeautifulSoup(c['text'], 'lxml').text)
                comments.append(c['user']['screen_name'])
            comments.reverse()
            return comments
        else:
            return ()
    except:
        return ()
    

# 根据用户uid获取该用户第一页的微博消息
def get_single_user_fisrt_weibo(uid):
    page_num = 1
    nickname = None
    weibo = None
    try:
        json = r.get(
            ('https://m.weibo.cn/api/container/getIndex?'
            'is_search[]=0&'
            'visible[]=0&'
            'is_all[]=1&'
            'is_tag[]=0&'
            'profile_ftype[]=1&'
            'page={0}&'
            'jumpfrom=weibocom&'
            'sudaref=weibo.com&'
            'type=uid&'
            'value={1}&'
            'containerid=107603{1}').format(page_num, uid),
            verify=False,
        ).json()
    except:
        return None, None
    if json['ok'] == 0:
        print('sth wrong')
        return None, None
    else:
        for card in json['cards']:
            if card['card_type'] == 9:
                weibo = [
                    card['mblog']['created_at'],
                    BeautifulSoup(
                        card['mblog']['text'], 'lxml'
                    ).text.replace(' \u200b\u200b\u200b', ''),
                    *get_comments_from_one_weibo(
                        card['mblog']['id']),
                ]

                nickname = card['mblog']['user']['screen_name'] + ' '
                
                break # 取第一个即可
    print('success for', nickname, ' - time', time.ctime())
    return nickname, weibo

# 使用itchat登录网页版微信
import itchat
itchat.auto_login()
# 以小号登录形式,要先找到大号的账户
# username = itchat.search_friends(name='xx')[0]['UserName']
username = 'filehelper'

import json
from collections import defaultdict
records = defaultdict(lambda : (None, None))
while 1:
    for uid in uids:
        nickname, weibo = get_single_user_fisrt_weibo(uid)
        
        try_times = 5
        while nickname == None:
            nickname, weibo = get_single_user_fisrt_weibo(uid)
            try_times -= 1
            if try_times == 0:
                break
        if try_times == 0:
            continue

        if records[nickname][1:] != weibo[1:]:
            # print('发现新微博:', weibo)
            itchat.send(
                '\n---\n'.join((nickname, *weibo)),
                toUserName=username)
            records[nickname] = weibo # 记录当前微博信息
            
            with open('data.json', 'w', encoding='utf-8') as f:
                json.dump(records, f, ensure_ascii=False)
        else:
            print('没有新消息', time.ctime())
            pass
    time.sleep(120)

你可能感兴趣的