当前位置: 首页>JAVA>正文

商標買賣,信用百度公司商標信息爬取

商標買賣,信用百度公司商標信息爬取

信用百度公司商標信息和圖片爬取,ip代理和動態header沒做,這只是個測試小腳本,可以在這個基礎上繼續修改,小改動后再選擇自己的存儲方式直接存儲就好。
希望對大家有幫助。直接復制粘貼即可使用

import re
import time
import requests
from lxml import etree
import json
import execjs
import uuid,oss2
from requests.packages.urllib3.exceptions import InsecureRequestWarning# 禁用安全請求警告
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)#獲取搜索公司后的結果列表
def get_company_list():company_name = ['徐州靈匠信息科技有限公司']resp = requests.get(url="https://xin.baidu.com/s?q=%s&t=0" % company_name[0],headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3534.4 Safari/537.36"},verify=False)response = resp.content.decode()html = etree.HTML(response)urls = html.xpath('//*[@class="zx-list-wrap"]/div//a[@class="zx-list-item-url"]/@href')for url in urls:get_markinfo(company_name, "https://xin.baidu.com" + url)#獲取組成請求的參數pid,tk
def get_markinfo(company_name, url):resp = requests.get(url, headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3534.4 Safari/537.36"},verify=False)text = resp.textresponse = resp.content.decode()html2 = etree.HTML(response)d = html2.xpath('//*[@id="baiducode"]/text()')[0]pid = eval(re.findall(r'"pid":(.*?)\,.*?"defTags"', text, re.S)[0])id1, att = re.findall(r"document\.getElementById\('(.*?)'\)\.getAttribute\('(.*?)'\)", text)[0]tk_func = "function mix(" + re.findall(r'mix\((.*?)\(function', text, re.S)[0]# print(tk_func)tk = re.findall(att + r'="(.*?)"\>', text)[0]# print(tk, d)tk = execjs.compile(tk_func).call('mix', tk, d)# print(tk)time1 = int(time.time() * 1000)url1 = "https://xin.baidu.com/detail/markAjax?pid={}&tot={}&_={}".format(pid, tk, time1)get_company_mark_info(url1, pid, tk, company_name)#發送請求獲取商標
def get_company_mark_info(url, pid, tk, company_name):try:resp1 = requests.get(url, headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3534.4 Safari/537.36"})data = json.loads(resp1.content.decode('unicode_escape'))pageCount = data['data']['pageCount']if pageCount == 0:print('-------', company_name, '暫未有注冊的商標數據')elif pageCount == 1:print('-------', company_name, '只有一頁數據')for da in data['data']['list']:markName = da['markName'] #商標名markNo = da['markRegNo']  #商標號mareImg = da['markStyle']   #商標markType = da['markType']   #商標類型markValidTime = da['markValidTime'] #有效時間markStatus = da['markStatus'] #注冊方式else:page = data['data']['page']print('-------', company_name, '有多頁數據,當前是第%d頁---' % page)for da in data['data']['list']:markName = da['markName'] #商標名markNo = da['markRegNo']  #商標號mareImg = da['markStyle']   #商標地址#上傳到oss# markeImg = update_img(da['markStyle'])# if markeImg is not None:#     print('商標上傳成功')# else:#     print('上傳成功')markType = da['markType']   #商標類型markValidTime = da['markValidTime'] #有效時間markStatus = da['markStatus'] #注冊方式print(da)if page is not pageCount:for i in range(2, pageCount + 1):print(i)url1 = "https://xin.baidu.com/detail/markAjax?pid={}&tot={}&_={}&p={}".format(pid, tk, int(time.time() * 1000), i)get_company_mark_info(url1, pid, tk, company_name)else:print('-------', company_name, '商標數據循環輸出完畢')# print(resp1.content.decode('unicode_escape'))except Exception as e:print('get_company_mark_info方法出現錯誤:', e)#商標上傳到oss,使用的是oss存儲圖標,
def update_img(url):account='賬號'key='密碼'uid = uuid.uuid1()auth = oss2.Auth(account, key)bucket = oss2.Bucket(auth, 'http://oss-cn-hangzhou.aliyuncs.com', 'juhe-app')try:input = requests.get(url)path = 'zb_news/%s.jpg' % uid #存儲路徑result = bucket.put_object(path, input)if result.status == 200:return 'http://juhe-app.oss-cn-hangzhou.aliyuncs.com/' + pathreturn Noneexcept:return None#啟動程序
def run():get_company_list()if __name__=='__main__':run()

https://www.nshth.com/java/338485.html
>

相关文章:

  • 商標買賣
  • 商標檢索網站
  • 查詢商標是否已注冊
  • 商標搜索平臺
  • 商標 申請
  • python爬蟲爬取招聘信息
  • 爬取網頁信息
  • 商標分類
  • 有一個解謎的有外星人的游戲,【Pygame小游戲】 史上最經典的外星人游戲 ,全面保障 勇敢去闖 (未解之謎)
  • 2020年2月編程語言排行榜:Java第一,Python出現下滑!
  • 開一家手機配件店怎么樣,手機配件實體店好做不_震驚!手機實體店,你不得不防的套路!
  • bld設計公司,BLE外設設計
  • 手機如何連接外設,iOS 連接外設的幾種方式
  • 三星手機換電池視頻教程,三星2016換電池教程
  • 機械設計制造畢業設計題目,機械專業夾具類畢業設計題目匯總/組合機床、車床撥叉、飛錘支架、連接座、倒擋撥叉、蓋、法蘭盤、銅襯軸套、心軸零件、曲軸箱零件、托板、發動
  • Shell基礎(四):字符串截取及切割、字符串初值的處理、基使用Shell數組、expect預期交互、使用正則表達式...
  • shell編程入門,shell基礎之04
  • 計算機基礎知識試題及答案(全),計算機序列類型和字典試題,計算機考試試題和資料
  • 新開店鋪怎么做推廣,淘寶新開店鋪沒有生意不會推廣的苦衷與心得
  • 如何注冊商標,給大家科普一下商標小知識沒注冊下來的商標,做吊牌,做包裝袋,發朋友圈廣告時千萬不能打R。將未注冊商標冒充注冊商標使用的,或者使用未注冊商標的,最高
  • 商標繳費后多久初步審核通過,商標注冊需要多久下證
  • 商標買賣,信用百度公司商標信息爬取
  • 商標檢索網站,中國商標網 -爬蟲
  • 應用商店上架app容易么,iOS App 上架App Store及提交審核(Appuploader)
  • app證書失效了怎么辦,iOS證書申請打包上傳App Store審核完整流程(7個步驟)
  • 銀行合并后,10萬億同業存款免繳存準 全面降準將推遲
  • kindle買8g還是32g,萬字長文!對比分析了多款存儲方案,KeeWiDB最終選擇自己來
  • java中的final關鍵字有哪些用法,Java: static,final,代碼塊 的詳解
  • 服務器反應慢及解決辦法,Linux服務器 大量的CLOSE_WAIT、TIME_WAIT解決辦法
  • wait for的用法,oracle for update wait 解析
  • 如何手動關閉close_wait,CLOSE_WAIT和TIME_WAIT
  • 渲染軟件哪個好用,Windows平臺OpenGL渲染視頻
  • 怎樣說代碼讓人聽不懂,RPA初級認證直通車,不懂代碼也能成為技術大佬
  • java快速開發平臺 開源,快上車!Java技術開發大廠直通車馬上啟動!
  • 架構師培訓,Java高級:java架構師成長直通車pan
  • 【淘寶開店教程】淘寶直通車常見問題講解
  • 《java架構師成長直通車》課程階段一學習筆記
  • 視頻教程-Java面試Offer直通車-Java