• 回答数

    3

  • 浏览数

    133

晓柚崽崽!
首页 > 职称论文 > 关于爬虫的论文开题报告

3个回答 默认排序
  • 默认排序
  • 按时间排序

薰衣草恋人

已采纳

基于python网络爬虫的设计与实现论文好写。因为基于python网络爬虫的设计与实现论文可以从网络上寻找相关的资料来攥写,比较方便,所以基于python网络爬虫的设计与实现论文好写。

243 评论

十架方舟

做爬虫,特别是python写说容易挺容易,说难也挺难的,举个栗子 简单的:将上面的所有代码爬下来写个for循环,调用urllib2的几个函数就成了,基本10行到20行以内的代码难度0情景:1.网站服务器很卡,有些页面打不开,urlopen直接就无限卡死在了某些页面上(以后urlopen有了timeout)2.爬下来的网站出现乱码,你得分析网页的编码3.网页用了gzip压缩,你是要在header里面约定好默认不压缩还是页面下载完毕后自己解压4.你的爬虫太快了,被服务器要求停下来喝口茶5.服务器不喜欢被爬虫爬,会对对header头部浏览器信息进行分析,如何伪造6.爬虫整体的设计,用bfs爬还是dfs爬7.如何用有效的数据结构储存url使得爬过的页面不被重复爬到8.比如1024之类的网站(逃,你得登录后才能爬到它的内容,如何获取cookies以上问题都是写爬虫很常见的,由于python强大的库,略微加了一些代码而已难度1情景:1.还是cookies问题,网站肯定会有一个地方是log out,爬虫爬的过程中怎样避免爬到各种Log out导致session失效2.如果有验证码才能爬到的地方,如何绕开或者识别验证码3.嫌速度太慢,开50个线程一起爬网站数据难度2情景:1.对于复杂的页面,如何有效的提取它的链接,需要对正则表达式非常熟练2.有些标签是用Js动态生成的,js本身可以是加密的,甚至奇葩一点是jsfuck,如何爬到这些难度3总之爬虫最重要的还是模拟浏览器的行为,具体程序有多复杂,由你想实现的功能和被爬的网站本身所决定爬虫写得不多,暂时能想到的就这么多,欢迎补充

103 评论

水蓝色的风铃

叙述和描写为主,但往往兼有抒情和议论,是一种形式多样,笔墨灵活的文体,也是最广泛的文体。论文写作,是把自己的亲身感受和经历通过生动、形象的语言,描述给读者。论文包括的范围很广,如记人记事,日记、游记、人物传记、传说、新闻、通讯、小说等,都属于论文的范畴。论文写的是生活中的见闻,要表达出作者对于生活的真切感受。

140 评论

相关问答

  • 关于我的论文开题报告

    开题报告的格式及如何写论文开题报告 大学生活将要谢下帷幕,大家都在认真的做毕业设计,而我们做毕业设计前指导老师都会要求先写开题报告,来参考自己需要的开题报告吧!

    稥油菋精 4人参与回答 2023-12-07
  • 关于信的论文开题报告

    毕业论文开题报告 论文题目: 学生姓名: 学 号: 专 业: 指导教师: 年 月 日 开题报告填写要求 1.开题报告作为毕业设计(论文)答辩委员会对学生答辩资格

    365033189次 2人参与回答 2023-12-10
  • 关于爬虫的论文开题报告

    基于python网络爬虫的设计与实现论文好写。因为基于python网络爬虫的设计与实现论文可以从网络上寻找相关的资料来攥写,比较方便,所以基于python网络爬

    晓柚崽崽! 3人参与回答 2023-12-07
  • 关于文学论文的开题报告

    汉语言文学专业培养具有汉语言文学基本理论、基础知识和基本技能 ,能在新闻文艺出版部门、科研机构和机关企事业单位从事文学评论、汉语言文学教学与研究工作,以及文化、

    颖颖emma 3人参与回答 2023-12-09
  • 关于开题报告方面论文开题报告

    论文开题报告模板!直接套用! 每一个内容都有参考句式,把自己的研究内容往上套即可。 1. 论题的背景及意义 例:...研究有利于全面...的特点,可以丰富现..

    添喜lucklily 4人参与回答 2023-12-06