<td id="ae6ms"><li id="ae6ms"></li></td>

<xmp id="ae6ms"><td id="ae6ms"></td><table id="ae6ms"></table>

<table id="ae6ms"></table>

^{<td id="ae6ms"></td>}

<td id="ae6ms"></td>

<table id="ae6ms"></table><table id="ae6ms"><td id="ae6ms"></td></table>

<td id="ae6ms"></td>

<table id="ae6ms"><li id="ae6ms"></li></table>

<table id="ae6ms"></table>

西西軟件園多重安全檢測下載網站、值得信賴的軟件下載站！

軟件教程 | 最新更新 | 下載排行 | 軟件分類 | 軟件專題 | 軟件發布

軟件: 軟件; 文章

搜索

python爬取微博評論源碼

軟件大小:1KB
更新時間:2020-03-28 09:59
軟件語言:中文
軟件廠商:
軟件類別:國產軟件 / 免費軟件 / 源碼相關
軟件等級:
應用平臺:WinXP, Win7, win8
官方網站:暫無

本地下載文件大小:1KB高速下載需先下載高速下載器

相關軟件

頂好評:50%

踩壞評:50%

請簡要描述您遇到的錯誤，我們將盡快予以修正。

轉帖到論壇

輪壇轉帖HTML方式

輪壇轉帖UBB方式

本類軟件分類

本類精品

易語言殺進程源碼
887KB/中文/5.2

本類下載排行

裝機必備軟件

QQ2020聊天工具
影音先鋒 視頻播放
360安全衛士安全軟件
迅雷10 下載工具
驅動精靈硬件驅動
釘釘 辦公聊天

軟件介紹

python爬取微博評論源碼，由論壇大神原創制作的一個爬取程序，可以爬取微博評論，用戶可以單獨搜索某個博主的微博，搜索歷史時間線，快速爬取獲取目標微博下的全部評論，并直接導入到txt文檔內。本次放出python爬取微博評論工具源碼下載，感興趣的朋友們不妨試試吧！

python爬取微博評論源碼

python爬取微博評論思路

打開網址[https://m.weibo.cn/detail/4478512314460101]

點擊萬能的F12

點擊：->網絡->XHR->hotflow.....->預覽

網址：[https://m.weibo.cn/comments/hotflow?id=4478512314460101&mid=4478512314460101&max_id_type=0]

已經可以確定這個是評論的json接口了

然后看第二頁有什么區別

往下拉，看第二頁

看來數據沒什么區別

第一頁網址：[https://m.weibo.cn/comments/hotflow?id=4478512314460101&mid=4478512314460101&max_id_type=0]

第二頁網址：[https://m.weibo.cn/comments/hotflow?id=4478512314460101&mid=4478512314460101&max_id_type=0&max_id=17250816281250492]

咦，第一頁和第二頁多出來一個max_id參數（后面其他頁數也是這里就不做演示了）

看一下第一頁數據中是否有max_id

果然有max_id，還是第二頁的（看懂了一切）

那就是說：第二頁的max_id在第一頁中，第三頁的在第二頁中，以此類推

python爬取微博評論源碼

import requests

import json

import re

import os

'''

說明:請添加第11行的cookie，修改第26行的保存路徑

作者:帥氣逼人的鋼鐵直男---幻夜

'''

headers = {#請求標題頭

'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4086.0 Mobile Safari/537.36',

'cookie':''#請填寫自己的cookie

}

id = input("請輸入ID:")#獲取ID

if id == "":#當ID為空停止腳本

print('再見')

os._exit(0)#停止腳本

ret = requests.get('https://m.weibo.cn/detail/'+id,headers = headers).text#獲取網頁內容

if '出錯了' in str(ret):#網頁出錯停止腳本

print('ID不存在')

os._exit(0)#停止腳本

title = input("請輸入保存文件名字:")#輸入保存文件名字

if title == "":#為空停止腳本

print('再見')

os._exit(0)#停止腳本

max_id = False#定義變量

path = "C:\\Users\\win10\\Desktop\\python\\爬蟲\\"+title+".txt"#自己修改文件路徑

if os.path.exists(path):#當文件存在時刪除，為了不重復

os.remove(path)#刪除

page_end = 10#爬取頁數，自己修改

page_start = 1

u = 1

while page_start<page_end:#當start小于end時進行循環

if max_id == False:#因為微博第一頁和其他頁的參數不一樣所以需要區分開來

url = "https://m.weibo.cn/comments/hotflow?id="+id+"&mid="+id+"&max_id_type=1"#第一頁不包含max_id

json = requests.get(url)#訪問評論json數據

else:

url = "https://m.weibo.cn/comments/hotflow?id="+id+"&mid="+id+"&max_id="+str(max_id)+"&max_id_type=0"

json = requests.get(url,headers = headers)#訪問評論json數據

json = json.json()#轉化數據

max_id = json['data']['max_id']#第二頁的max_id在第一頁中第三頁在第二頁中...以此類推

jsons = json['data']['data']

page_start = page_start+1#自增

for j in jsons:

text = j['text']

text = re.sub(r'<(.+?)>','',text)#刪除表情包

with open(path,"a+",encoding = 'utf-8') as f:

f.write(text+'\n\n')

print("第"+str(u)+"條評論完成")

u = u+1

print('完成')

相關新聞

3月20日消息天眼查數據顯示，3月19日，微博的運營主體——北京微夢創科網絡技術有限公司發生多項工商變更。

其中，劉運利退出法定代表人、經理、執行董事，新增微博代理首席財務官兼高級副總裁曹菲為法定代表人、董事長、經理；新增黃爭取、谷海燕為董事。此外，注冊資本從原來的5.55億增至約5.6億，增幅為1.01%，其經營范圍也發生了變更。

北京微夢創科網絡技術有限公司成立于2010年8月，天眼查股東信息顯示，王巍、劉運利分別持股29.70%，為公司最大股東。

軟件標簽: python 微博爬取

軟件截圖

python爬取微博評論源碼

上一張下一張(1 / 1)

安裝詳細截圖

下載地址

python爬取微博評論源碼

本類軟件推薦

PHP和MySQL Web開發第4版源代碼

SSH框架整合小案例

易語言罵人工具源碼免費版

PHP操作excel類(PHPExcel)1.7.7

51單片機150個例程

HTML 5開發精要與實例詳解配套源碼

HTML-CSS-JavaScript標準教程實例版

逐夢旅程：Windows游戲編程之從零開始配套源代碼

c語言經典編程900例

C# 教務管理系統源碼

易語言殺進程源碼

C++Builder學習大全中文版

相關文章精選

其他版本下載

熱門評論

最新評論

下載幫助下載幫助西西破解版軟件均來自互聯網, 如有侵犯您的版權, 請與我們聯系。

TOP

軟件下載

聯系我們 | 發展歷程 | 版權聲明 | 下載幫助(？) | 廣告服務 | 軟件提交 | 意見反饋

聲明：西西軟件園為非贏利性網站不接受任何贊助和廣告

女人让男人桶30分钟免费视频，女人张开腿让男人桶个爽，一进一出又大又粗爽视频

<td id="ae6ms"><li id="ae6ms"></li></td>

<xmp id="ae6ms"><td id="ae6ms"></td><table id="ae6ms"></table>

<table id="ae6ms"></table>

^{<td id="ae6ms"></td>}

<td id="ae6ms"></td>

<table id="ae6ms"></table><table id="ae6ms"><td id="ae6ms"></td></table>

<td id="ae6ms"></td>

<table id="ae6ms"><li id="ae6ms"></li></table>

<table id="ae6ms"></table>