1、创建虚拟环境
1 | conda create -n autocreteweb python=2.7 |
2、创建文件夹C:\Users\Kevin\autocreateweb\,并将代码复制进来。
3、安装相关的python包
4 | pip install beautifulsoup4 |
4、解决出错
执行测试脚本的时候,出现了“No module named QA.QACRawler”的错误,经查看,是项目内部python文件调用同级文件夹下面的python文件出错。后来,通过在网上搜索,原来需要在调用py文件的文件中(即MainProgram.py),添加这两句即可:
然后程序终于可以运行了:

5、解决乱码问题
原脚本是在linux下开发的,到了windows CMD下面运行,中文全成乱码了。在网上找了一个暂时的解决方案,即在脚本中加入以下代码:
2 | type=sys.getfilesystemencoding() |
然后在输出乱码的数据的时候在后面加上.decode('utf-8').encode(type),比如下面这样的
5 | print a.encode( "utf8" ).decode( 'utf-8' ).encode(type) |
7 | print 'Eric:' + ans[0].encode( "utf8" ).decode( 'utf-8' ).encode(type) |
这样的话,虽然仍有乱码,可是暂时可以用了。

6、测试问题


这里用的是百度知道。


这里用的是百度百科内容
可参考:
http://www.360doc.com/content/16/1116/20/2459_607094835.shtml
https://home.pandorabots.com/home.html#features