• 回答数

    5

  • 浏览数

    287

贪吃女王Grief
首页 > 学术期刊 > java邮件毕业论文

5个回答 默认排序
  • 默认排序
  • 按时间排序

玛雅家具

已采纳

摘 要网络中的资源非常丰富,但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。本论文首先详细介绍了基于英特网的搜索引擎的系统结构,然后从网络机器人、索引引擎、Web服务器三个方面进行详细的说明。为了更加深刻的理解这种技术,本人还亲自实现了一个自己的Java搜索引擎——新闻搜索引擎。新闻搜索引擎是从指定的Web页面中按照超连接进行解析、搜索,并把搜索到的每条新闻进行索引后加入数据库。然后通过Web服务器接受客户端请求后从索引数据库中搜索出所匹配的新闻。本人在介绍搜索引擎的章节中除了详细的阐述技术核心外还结合了新闻搜索引擎的实现代码来说明,图文并茂、易于理解。 关键字:搜索引擎,网络机器人,Lucene,中文分词,JavaCC AbstractThe resources in the internet are abundant, but it is a difficult job to search some useful information. So a search engine is the best method to solve this problem. This article fist introduces the system structure of search engine based on the internet in detail, and then gives a minute explanation form Spider search, engine and web server. In order to understand the technology more deeply, I have programmed a news search engine by myself in Java.The news search engine is explained and searched according to hyperlink from a appointed web page, then indexes every searched information and adds it to the index database. Then after receiving the customers' requests from the web server, it soon searches the right news form the index engine,In the chapter of introducing search engine, it is not only elaborating the core technology, but also combine with the modern code, pictures included, easy to understand. Key Words:Search Engine, Spider, Lucene, Phrase Query, JavaCC 目 录第1章 引言··· 11.1 选题背景:··· 11.2 现实意义··· 1第2章 搜索引擎的结构··· 32.1 系统概述··· 32.2 搜索引擎的构成··· 32.2.1 网络机器人··· 32.2.2 索引与搜索··· 32.2.3 Web服务器··· 32.3 搜索引擎的主要指标及分析··· 42.4 小节··· 4第3章 网络机器人··· 53.1 什么是网络机器人··· 53.2 网络机器人的结构分析··· 53.2.1 如何解析HTML· 53.2.2 该类几种重要的方法。··· 63.2.3 Spider程序结构··· 63.2.4 如何构造Spider程序··· 73.2.5 如何提高程序性能··· 83.2.6 网络机器人的代码分析··· 93.3 小节··· 10第4章 基于Lucene的索引与搜索··· 114.1 什么是全文检索与全文检索系统?··· 114.2 什么是Lucene全文检索··· 124.3 Lucene的系统结构分析··· 134.3.1 系统结构组织··· 134.3.2 数据流分析··· 144.4 Lucene索引构建逻辑模块分析··· 154.4.1 绪论··· 154.4.2 对象体系与UML图··· 164.4.3 Lucene的包结构··· 204.4.4 Lucene的主要逻辑图··· 214.4.5 对Lucene包的小结··· 224.5 Lucene查询逻辑··· 224.5.1 查询者输入查询条件··· 224.5.2 查询条件被传达到查询分析器中··· 224.5.3 查询遍历树··· 234.5.4 返回结果··· 234.6 Lucene 检索原理··· 234.7 Lucene和Nucth的中文分析模块··· 254.7.1 Nutch分析··· 254.7.2 Nutch中文搜索3.1 中文分词··· 264.7.3 利用JavaCC构造中文分析模块··· 274.7.4 分词小结··· 284.8 Lucene与Spider的结合··· 284.8.1 Index类的实现··· 284.8.2 HTML解析类··· 294.9 Lucene 小结··· 31第5章 基于Lucene的搜索引擎实现··· 325.1 基于Tomcat的Web服务器··· 325.1.1 什么是基于Tomcat的Web服务器··· 325.2 用户接口设计··· 325.2.1 客户端设计··· 325.2.2 服务端设计··· 335.3 在Tomcat上部署项目··· 355.4 小节··· 35第6章 搜索引擎策略··· 366.1 简介··· 366.2 面向主题的搜索策略··· 366.2.1 导向词··· 366.2.2 网页评级··· 366.2.3 权威网页和中心网页··· 376.3 小节··· 38结束语··· 39参考文献··· 40致 谢··· 41外文资料原文··· 42外文原文翻译··· 48 第1章 引言1.1 选题背景:面对浩瀚的网络资源,搜索引擎为所有网上冲浪的用户提供了一个入口,毫不夸张的说,所有的用户都可以从搜索出发到达自己想去的网上任何一个地方。因此它也成为除了电子邮件以外最多人使用的网上服务。搜索引擎技术伴随着WWW的发展是引人注目的。搜索引擎大约经历了三代的更新发展:第一代搜索引擎出现于1994年。这类搜索引擎一般都索引少于1,000,000个网页,极少重新搜集网页并去刷新索引。而且其检索速度非常慢,一般都要等待10秒甚至更长的时间。在实现技术上也基本沿用较为成熟的IR(Information Retrieval)、网络、数据库等技术,相当于利用一些已有技术实现的一个WWW上的应用。在1994年3月到4月,网络爬虫World Web Worm (WWWW)平均每天承受大约1500次查询。大约在1996年出现的第二代搜索引擎系统大多采用分布式方案(多个微型计算机协同工作)来提高数据规模、响应速度和用户数量,它们一般都保持一个大约50,000,000网页的索引数据库,每天能够响应10,000,000次用户检索请求。1997年11月,当时最先进的几个搜索引擎号称能建立从2,000,000到100,000,000的网页索引。Altavista搜索引擎声称他们每天大概要承受20,000,000次查询。结束语本课题对基于因特网的Java搜索引擎结构和性能指标进行了分析,了解Spider程序的结构和功能。在进行海量数据搜索时,如果使用单纯的数据库技术,那将是非常痛苦的,速度将是极大的瓶颈。所以本文提出了使用全文搜索引擎Lucene进行索引、搜索。解决中文分词和有效的中文搜索信息。同时解决了如何把Lucene全文搜索引擎和Spider程序互相集合来实现新闻搜索的功能。对于如何构架基于Tomcat的Web服务器,使得用户通过浏览器进行新闻的搜索有了一定的理解,对Tomcat如何部署进行了说明。在些基础上,终于可以调试出一个简单的在本地搜索新闻Java搜索引擎。参考文献[1] Jeff Heaton(美), Programming Spiders, Bots, and Aggregator in Java.[2] Borland Software Corporation(美),JBuilder培训教程(译者:周鹏 [等] 译)北京:机械工业出版社[3]徐宝文,张卫丰. 搜索引擎与信息获取技术.北京:清华大学出版社,2003.5[4]车东.基于Java的全文搜索引擎Lucene[5]罗旭.主题搜索引擎的设计与实现[6]Bruce Eckel(美).Thinking in Java.北京:机械工业出版社[7] Otis Gospodnetic Erik Hatcher (美).Action in Lucene.电子工业出版社,2007.1[8]耿祥义,张跃平. JAVA2实用教程(第二版).北京:清华大学出版社,2004.2[9]刘彬.JSP数据库高级教程.北京:清华大学出版社,2006.3[10]刘卫国,严晖.数据库技术与应用——SQL Server.北京:清华大学出版社,2007.1[11]闫宏飞.Tiny Search Engine: Design and implementation(PPT). Oct.2003[12]李晓明,闫宏飞,王继民.搜索引擎——原理、技术与系统.北京:科学出版社,2004 更多参考请点击

92 评论

尹才宝贝

有人帮你写了吗?我现在也愁着,论文一点头绪没有,马上就要交开题报告,不知道怎么写

113 评论

薰妍maggiel

网上去下,再稍稍改一下。我就是这么干的。。

107 评论

七月小太阳

有一个 ssh开发的 门户+论坛+博客 我自己的毕业设计 有文档 。。。 具体的 我空间有图片

248 评论

颖颖emma

1. JAVA网络通信系统的研究与开发 2. 本地监听与远程端口扫描的设计与开发 3. 基于Misty1算法的加密软件(Java)的实现 4. 论文格式化系统——后台模块的设计与实现 5. Web音乐搜索软件的设计与实现 6. 基于J2EE酒店管理系统设计与实现 7. 局域网监听软件的设计与开发 8. 网上考试及评析系统的设计与实现 9. 基于J2EE的公交查询系统的设计与实现 10. 面向Internet上的CSCW的共享白板的设计与实现 11. 基于Java的两个通用安全模块的设计与实现 12. 基于J2ME平台的掌上网络商店——客户端的开发 13. 银行帐目管理系统 14. 某百货店POS积分管理系统--积分点更新生成以及通票回收处理 15. 基于j2me平台的掌上网络商店-服务器端开发 16. EIMS系统-OA子系统的设计与开发 17. SMART系统—系统功能管理模块设计与开发 18. J2ME手机游戏的开发-Beckham Goa 19. 手机游戏(堡垒)的设计与开发 20. 一个简单的即时通讯工具的设计与开发 21. 泡泡堂网络游戏的设计与实现 22. 五子棋手机网络对战游戏的设计与实现 23. 机主留言功能在“全时通”系统上的实现 24. 某店POS积分管理系统——积分失效与数据分析模块的实现 25. B/S结构下的邮件系统的设计与开发 26. 在线考试系统的设计与实现 27. 基于JAVA C/S远程监控系统软件的实现 28. Java多线程与线程安全实践——基于Http协议的断点续传 29. 高校学生工作管理系统的设计与开发 30. 基于Java的五子棋游戏的设计 31. 文件压缩与解压缩实践 32. WML信息查询与后端信息发布系统实现——WML信息查询设计 33. FTP客户端软件的设计与实现 34. 基于Java ME无线网络移动端的俄罗斯方块游戏的实现 35. Java论坛管理系统 36. 离散数学题库管理系统 37. 基于Java3D的网络三维技术的设计与实现 38. 基于Java的在线购物系统的设计与实现 39. J2ME贪吃蛇游戏的设计 40. 在线考试 41. 办公自动化系统 42. Java Applet研究与应用——综合测评系统 43. 打飞机游戏毕业设计

324 评论

相关问答

  • 给毕业论文导师发邮件的邮件主题

    毕业论文找导师发邮件的写法如下: 篇一 XXX老师,您好;近些天,在您的帮助指导下,我的关于xxxx的毕业论文已经初步完成了,现在递上我的毕业论文给您,希望您提

    Loli心的怪蜀黎 3人参与回答 2023-12-08
  • java邮件毕业论文

    摘 要网络中的资源非常丰富,但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。本论文首先详细介绍了基于英特网的搜索引擎的系统结

    贪吃女王Grief 5人参与回答 2023-12-12
  • 毕业论文选题邮件名

    老师的邮箱。论文题目还是比较正式的一个东西,建议邮件发送给导师审核。可以QQ告诉老师已发送TA邮件。给导师发邮件的主题中必须要包含自己的名字,这样可以方便导师日

    小小乖肉球 2人参与回答 2023-12-12
  • 毕业论文导师选择邮件

    毕业论文找导师发邮件的写法如下: 篇一 XXX老师,您好;近些天,在您的帮助指导下,我的关于xxxx的毕业论文已经初步完成了,现在递上我的毕业论文给您,希望您提

    小璇璇APPLE 2人参与回答 2023-12-05
  • 请老师改毕业论文邮件

    问题一:请求老师改论文该怎么说比较好呢? 在“斧正”过程指的是双方应该是“技术水平”很高的人物中进行的,这就不难理解应该是“高手”间的切磋。 如果是同学、

    Too兔rich 1人参与回答 2023-12-07