Python

人生苦短,我用Python。

正则与beautifulsoup

正则与beautifulsoup 一、正则 (一)几个使用正则的实例 1.查找 比如:要从“共200页,到第', '页”里面取出200这个数字, pagenum=re.findall(r'\d',str) #取到的是一个列表['5', '0', '0'] x = soup.find_all('p') #找到所有p标签 2.替换 sub三个必选参数:pattern, repl, string, repl,就是replacement,被替换成的字符串……

tkinter的小Demo

0

tkinter的小Demo 一、学习要点 1.生成窗口,显示窗口。 2.按行展示,合并列(clounspan)。 二、代码 # 引用tkinter工具包 from tkinter import * #__all__=[a,b] from tkinter import messagebox # 定义关闭窗口提示 def closeWindow(): messagebox.showinfo(title="警告",message ="滚回去,必须选一个") ……

链家二手房爬虫

0

链家二手房爬虫 爬取时间:2020年4月30日 一、结果 网址 城市 二手房数量 https://bj.lianjia.com/ 北京  89386 https://sh.lianjia.com/ 上海  59926 https://sz.lianjia.com/ 深圳  42959 https://aq.lianjia.com/ 安庆  13962 https://cz.fang.lianjia.com/ 滁州 0 https://hf.lianjia.com/ 合肥  65502 https://mas……

python常用代码(一)

0

python常用代码(一) 一、文件相关操作 1.打开txt文件 with open("77.txt", "r",encoding='utf-8') as f: for line in f.readlines(): line = line.replace("\n", "") 备注: 有时碰到有空行的txt文件要用下面的方法 with open("url_list.txt", "r",encoding='utf-……

采集知网论文+云打码

0

采集知网论文+云打码 一、代码 二、出错 可是下载了一百多篇论文就报错了,原来出现了验证码。可是我设定为自动识别验证码了,还是报以下的错误。 ERROR:root:出现验证码 Traceback (most recent call last): File "main.py", line 144, in parse_page tr_table.tr.extract() AttributeError: 'NoneType' object has no attribute 'tr……

从Tushare获取数据展示双均线策略

0

从Tushare获取数据展示双均线策略 一、Tushare简介 Tushare是一个财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工 到 数据存储的过程,能够为金融分析人员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大地减轻工作量,使他们更加专注于策略和模型的研究与实现上。考虑到Python pandas包在金融量化分析中体现出的优势,……

Python常用代码(二)

0

Python常用代码(二) 一、输入输出控制 raw_input(unicode('请输入文字','utf-8').encode('gbk')) #解决输入提示中文乱码问题 print a.prettify() #格式化输出 二、进度条控制 from __future__ import division import sys,time j = '#' for i in range(1,61): j += '#' sys.……

站长网关键词采集(爬虫)

0

站长网关键词采集(爬虫) 本文知识点: 1、复习了类的写法。 2、复习了scrapy先大范围取数,然后for循环取每一个item的用法。取大范围值的时候,在python中print不出来也没有问题,比如本文中的node_list,for循化中可以取出就可以了。 3、学习了写入Mysql时自动生成时间的方法。 4、学习了xpaht中的“.//”、“./”的写法。 5. Mysql避免数据重复插入……

Page: 4 of 17 1 2 3 4 5 6 7 8 9 10 11 12 ... 17