

Python 获取景点代码
source link: https://xushanxiang.com/2019/07/python-captures-tourist-attraction-data.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

Python 获取景点代码
本文章是以python3写的一个获取代码的案例。
from tqdm import tqdm
import time
from selenium import webdriver
from selenium.common.exceptions import TimeoutException, WebDriverException
import pandas as pd
import numpy as np
import os
position = ["北京","天津","上海","重庆",
"河北","山西","辽宁","吉林",
"福建","江西","山东","河南",
"湖北","湖南","广东","海南",
"四川","贵州","云南","陕西",
"甘肃","青海","台湾","内蒙古",
"广西","西藏","宁夏","新疆",
"香港","澳门"
]
position = ['北京']
name,level,hot,address,num=[],[],[],[],[]
def get_one_page(key,page):
try:
option_chrome = webdriver.ChromeOptions()
option_chrome.add_argument('--headless')
driver = webdriver.Chrome(chrome_options=option_chrome)
time.sleep(5)
url="http://piao.qunar.com/ticket/list.htm?keyword="+str(key)+"®ion=&from=mpl_search_suggest&page="+str(page)
driver.get(url)
infor = driver.find_elements_by_class_name("sight_item")
for i in range(len(infor)):
#景点名字
name.append(infor[i].find_element_by_class_name("name").text)
#获取景点评级
try:
level.append(infor[i].find_element_by_class_name("level").text)
except:
level.append("")
#获取景点热度
hot.append(infor[i].find_element_by_class_name("product_star_level").text[3:])
#获取景点地址
address.append(infor[i].find_element_by_class_name("area").text)
#huo qu jing dian xiao liang
try:
num.append(infor[i].find_element_by_class_name("hot_num").text)
except:
num.append(0)
driver.quit()
return
except TimeoutException or WebDriverException:
return get_one_page()
for key in tqdm(position):
print("正在爬取{}".format(key))
for page in range(1,14):
print("正在爬取第{}页".format(page))
get_one_page(key,page)
sight = {'name': name, 'level': level, 'hot': hot, 'address': address, 'num':num}
sight = pd.DataFrame(sight, columns=['name', 'level', 'hot', 'address', 'num'])
sight.to_csv("sight.csv",encoding="utf_8_sig")
在这个代码需要下载chromedriver.exe。下载地址是:
http://chromedriver.chromium.org/downloads
本案例获取的数据是以.csv格式保存到本地。
如果觉得我的文章对您有用,请随意赞赏。您的支持将鼓励我继续创作!
发表评论 取消回复
电子邮件地址不会被公开。 必填项已用*标注
Recommend
-
43
每日一景点:繁华闹市人醉夜,弥敦道的前世今生 香港的灵魂,来自什么值得买甄选出的什么值得买优惠产品,汇聚数十万什么值得买网友对该网购产品的点评。
-
26
每日一景点:小桥流水人家,宏村的静谧繁华 水墨画里的村庄,来自什么值得买甄选出的什么值得买优惠产品,汇聚数十万什么值得买网友对该网购产品的点评。
-
50
每日一景点:大美三沙 一片令人神往的土地 离中国南海最近的城市,来自什么值得买甄选出的什么值得买优惠产品,汇聚数十万什么值得买网友对该网购产品的点评。
-
33
全中国最坑爹的景点,我都去过! 旅游 / 人造景点 ...
-
7
东莞观音山网红景点被围蔽,游客呼吁早开放2020-12-21 21:08:21 来源:投资家网 作者:
-
9
杭州景点体验概览杭州景点体验概览1.西湖–西湖音乐喷泉–三潭印月–断桥残雪–苏堤–白堤–西湖游船–曲院风荷–六和塔–花港观鱼–梅家坞–云栖竹径–龙井路与满觉陇路–孤山公园–虎跑公园–杨公堤2.灵隐寺(飞来峰)景区—-北高峰索道3.宋城...
-
11
上海景点体验概览上海景点体验概览1.理工大学 大草坪,小溪流,小森林,运动场,食堂,能玩半天。 !!2.理工大学边上商场游乐场 儿童游乐设施,能玩半天 !!3.上海植物园 各类植物,大众活动区,能野餐,有风景,有花有草,有大草...
-
6
你吃过网红雪糕吗? 文章转载自:网易上流 ID:heyupflow 编辑:zkey 友友萌,要说2021年最火的词儿,那内卷一定能排得上号。通俗意义上说,内卷就是通货膨胀式的努力。现如今,内卷已经不止“人传人”了,它已开始向雪糕界发展。一出身就...
-
4
网络公认的「伦敦最糟糕景点」,实际耗资 600 万英镑 原以为大神级别的设计师和工作室,就能像原研斋老师设计小米 logo 一样,客户「照单全收」,将设计图上的创意原封不动地实现出来。 ——但最近国际知名建筑事务...
-
7
延安红街登上景点人气榜首 成为延安新晋网红 Connect with us 延安红街的快速蹿红绝非偶然。
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK