layui 发表于 2025-3-21 20:17:19

强烈推荐网站镜像离线工具 httrack

macOS brew 快速安装:brew install httrack<br />
<br />
命令:<div class="blockcode"><div id="code_DHh"><ol><li>httrack &quot;https://anime-86.com&quot; -O ~/Downloads/anime-86-site -c8 \<br /><li>--user-agent &quot;Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/18.4 Safari/605.1.15&quot;</ol></div><em onclick="copycode($('code_DHh'));">复制代码</em></div><br />
<br />
目标网站:https://anime-86.com<br />
缓存本地目录:~/Downloads/anime-86-site<br />
下载线程数8:-c8<br />
<br />
<br />
以前使用wget下载工具,部份动态网页会出问题。比如:<br /><div class="blockcode"><div id="code_kRZ"><ol><li>https://anime-86.com/news/<br /><li><br /><li>https://anime-86.com/story/</ol></div><em onclick="copycode($('code_kRZ'));">复制代码</em></div><br />
wget 本地文件:<br /><div class="blockcode"><div id="code_GEF"><ol><li>index.html<br /><li>story?id=01<br /><li>story?id=02<br /><li>story?id=03<br /><li>...</ol></div><em onclick="copycode($('code_GEF'));">复制代码</em></div><br />
<br />
httrack 本地网页:<br /><div class="blockcode"><div id="code_R54"><ol><li>index.html<br /><li>index0b48.html<br /><li>index1ffe.html<br /><li>index2e5f.html<br /><li>...</ol></div><em onclick="copycode($('code_R54'));">复制代码</em></div><br />
<br />
<br />
<br />
ChatGPT:<br />
<strong>httrack 常用参数说明</strong><br />
<br />
<strong>基本参数</strong><br />
<ul><li><strong>-O &lt;目录&gt;</strong> - 指定存储目录<li><strong>-c&lt;N&gt;</strong> - 设置并发连接数(默认 3,建议 4-8)<li><strong>--user-agent &quot;&lt;字符串&gt;&quot;</strong> - 伪装浏览器标识(User-Agent)<li><strong>--mirror</strong> - 仅下载网站,不解析本地文件<li><strong>--get-files</strong> - 仅下载单个文件,而不是整个网站<li><strong>--update</strong> - 增量更新已下载的网站<li><strong>--continue</strong> - 继续中断的下载<br />
</ul><br />
<br />
<strong>网络相关</strong><br />
<ul><li><strong>--proxy &lt;proxy:port&gt;</strong> - 使用代理服务器下载<li><strong>--disable-security-limits</strong> - 解除速度限制<li><strong>--sockets=N</strong> - 设置最大同时连接数<li><strong>-D</strong> - 只下载与主域匹配的链接(避免外链)<li><strong>-%v</strong> - 强制重新下载所有文件(忽略缓存)<br />
</ul><br />
<br />
<strong>过滤规则</strong><br />
<ul><li><strong>+*.jpg +*.png +*.gif</strong> - 仅下载指定格式的文件<li><strong>-ad.doubleclick.net/*</strong> - 排除特定域名的资源<li><strong>--depth=N</strong> - 限制下载深度<li><strong>--max-size=N</strong> - 限制最大文件大小<li><strong>--near</strong> - 尝试下载所有 HTML 引用的图片等资源<br />
</ul><br />
<br />
<strong>示例命令</strong><br /><div class="blockcode"><div id="code_Uw1"><ol><li><br /><li>httrack &quot;https://www.example.com&quot; -O ~/Downloads/example-site -c8 --user-agent &quot;Mozilla/5.0&quot;<br /><li></ol></div><em onclick="copycode($('code_Uw1'));">复制代码</em></div><br />

layui 发表于 2025-3-21 20:19:29

检索论坛信息,原来早在2018年就有人推荐过了<img src="https://hostloc.com/static/image/smiley/default/mad.gif" smilieid="11" border="0" alt="" /><br />
<br />
<a href="https://hostloc.com/thread-433819-1-1.html" target="_blank">https://hostloc.com/thread-433819-1-1.html</a>
页: [1]
查看完整版本: 强烈推荐网站镜像离线工具 httrack