什么叫网络爬虫又(yòu)有(yǒu)何作用(yòng)

义乌

热门上饶金华

首页

这里有(yǒu)我们最新(xīn)的签约信息及相关公司活动!

最近我们都在干什么？

什么叫网络爬虫又(yòu)有(yǒu)何作用(yòng)

类目：行业资讯发布日期：2015-09-11 点击：6338 次

网络爬虫（又(yòu)被称為(wèi)网页蜘蛛，网络机器人，在FOAF社區(qū)中间，更经常的称為(wèi)网页追逐者），是一种按照一定的规则，自动的抓取万维网信息的程序或者脚本。另外一些不常使用(yòng)的名字还有(yǒu)蚂蚁，自动索引，模拟程序或者蠕虫。

网络爬虫是一个自动提取网页的程序，它為(wèi)搜索引擎从万维网上下载网页，是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始，获得初始网页上的URL，在抓取网页的过程中，不断从当前页面上抽取新(xīn)的URL放入队列,直到满足系统的一定停止条件。聚焦爬虫的工作流程较為(wèi)复杂，需要根据一定的网页分(fēn)析算法过滤与主题无关的链接，保留有(yǒu)用(yòng)的链接并将其放入等待抓取的URL队列。

相对于通用(yòng)网络爬虫，聚焦爬虫还需要解决三个主要问题：

(1) 对抓取目标的描述或定义；

(2) 对网页或数据的分(fēn)析与过滤；

(3) 对URL的搜索策略。

抓取目标的描述和定义是决定网页分(fēn)析算法与URL搜索策略如何制订的基础。而网页分(fēn)析算法和候选URL排序算法是决定搜索引擎所提供的服務(wù)形式和爬虫网页抓取行為(wèi)的关键所在。这两个部分(fēn)的算法又(yòu)是紧密相关的。

相关文(wén)章推荐

纵利网络為(wèi)您服務(wù)：品牌网站建设、网站建设、高端网站建设、集团网站建设、网络营销、小(xiǎo)程序开发！公司专注于企业高端品牌设计开发的网络商(shāng)，涉及领域有(yǒu)义乌网站建设，金华网站设计公司，东阳网站制作，浦江营销网站建设，手机APP，微信公众号开发、小(xiǎo)程序开发、品牌网站建设，网络整合营销。目前為(wèi)區(qū)域内最具竞争力的网站建设公司。

電(diàn)话

公司座机：0579-85727800

售前咨询：188-5797-7268

售后咨询：188-5797-7268

更多(duō)联系方式，请点击进入
QQ客服

网站建设咨询网络营销咨询网站技术咨询网站备案咨询网站售后服務(wù) 网站售后服務(wù)
微信
我要定制
定制咨询

页面出错

意见建议

其他(tā)
请尽可(kě)能(néng)详细的描述您遇到的问题，我们会认真处理(lǐ)您提交的反馈，请留下您的联系方式，以便我们能(néng)更好的解决您的困惑。

首页

服務(wù)

案例

新(xīn)闻

公司

什么叫网络爬虫又(yòu)有(yǒu)何作用(yòng)