全球主机交流论坛备用站

 找回密码
 立即注册

QQ登录

只需一步,快速开始

全球云38元起免备案V2EX搬瓦工VPS
SEO查询超级PING网站测速
Virmach特价鸡乌云漏洞吾爱破解
查看: 161|回复: 5

现在蜘蛛抓取是不是基本都会执行网页的JS脚本了啊?

[复制链接]

252

主题

420

回帖

1888

积分

金牌会员

Rank: 6Rank: 6

积分
1888
发表于 2025-2-13 15:47:05 | 显示全部楼层 |阅读模式
20230417
网上教程都说蜘蛛机器人抓取不会去执行网页的.js脚本,

但是现在很多站点的真实内容, 都是先加载一个主框架,

然后通过.js 代码再在页面后台获取的,搜索引擎抓取展示的内容根本不受影响,

是不是现在蜘蛛抓取是不是基本都会执行网页的JS脚本了?

MJJ,你的签名掉了~~~
回复

使用道具 举报

252

主题

420

回帖

1888

积分

金牌会员

Rank: 6Rank: 6

积分
1888
 楼主| 发表于 2025-2-13 15:50:03 | 显示全部楼层
如果蜘蛛会允许js代码, 是不是我现在用 判断访问是否含有某个cookie,

来判断是蜘蛛还是真实用户, 这个方法就不行了 (cookie是在js代码设置的) ?

如果蜘蛛会运行js, 那它肯定也会有这个cookie了啊
MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

52

主题

602

回帖

1988

积分

金牌会员

Rank: 6Rank: 6

积分
1988
发表于 2025-2-13 16:10:32 | 显示全部楼层
有时候会执行js的
MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

13

主题

412

回帖

1113

积分

金牌会员

Rank: 6Rank: 6

积分
1113
发表于 2025-2-13 20:12:03 | 显示全部楼层
wawos 发表于 2025-2-13 15:50
如果蜘蛛会允许js代码, 是不是我现在用 判断访问是否含有某个cookie,

来判断是蜘蛛还是真实用户, 这个方 ...

蜘蛛请求头不是会带User Agent的嘛,把常用的UA收集一下。去拿他的User Agent。
百度ua:Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
谷歌ua:Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

252

主题

420

回帖

1888

积分

金牌会员

Rank: 6Rank: 6

积分
1888
 楼主| 发表于 2025-2-13 15:50:00 | 显示全部楼层
胖虎_ 发表于 2025-2-13 20:12
蜘蛛请求头不是会带User Agent的嘛,把常用的UA收集一下。去拿他的User Agent。
百度ua:Mozilla/5.0 ( ...

标准的蜘蛛UA才会带这些spider信息,

蜘蛛会模仿普通浏览器来判断你网站内容有没有作弊的
MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

13

主题

412

回帖

1113

积分

金牌会员

Rank: 6Rank: 6

积分
1113
发表于 2025-2-13 20:20:43 | 显示全部楼层
wawos 发表于 2025-2-13 20:20
标准的蜘蛛UA才会带这些spider信息,

蜘蛛会模仿普通浏览器来判断你网站内容有没有作弊的 ...

那就不清楚咯,现在大部分蜘蛛都是可以执行js的。
问问ai看看,有哪些是浏览器特有的,蜘蛛无法模仿的。
MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

展开

QQ|Archiver|手机版|小黑屋|全球主机交流论坛备用站

GMT+8, 2025-4-30 14:46 , Processed in 0.046640 second(s), 26 queries , Gzip On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表