<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>AutoDL on 33</title>
    <link>https://syl.moe5200.com/tags/autodl/</link>
    <description>Recent content in AutoDL on 33</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <copyright>2026 33</copyright>
    <lastBuildDate>Sun, 28 Jun 2026 02:30:00 +0000</lastBuildDate>
    <atom:link href="https://syl.moe5200.com/tags/autodl/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>AutoDL 下载 HF 数据集配置环境一次性跑通！稳定 15MB&#43;</title>
      <link>https://syl.moe5200.com/posts/engineering/autodl-hf-download-hfd/</link>
      <pubDate>Sun, 28 Jun 2026 02:30:00 +0000</pubDate>
      <guid>https://syl.moe5200.com/posts/engineering/autodl-hf-download-hfd/</guid>
      <description>&lt;p&gt;在AutoDL的服务器上，我在下载数据集和模型权重的时候踩了特别多的坑。
我尝试用过云盘传
也试过下载在本地，再通过服务器上传
全部都失败了！不是上传特别慢就是数据集太多，太散，太难传。
最后，我找到了解决方法的最终版本，下载速度稳定15MB+&lt;/p&gt;
&lt;p&gt;一：创建conda环境
conda create -n diffusionvl python=3.10 -y
conda activate diffusionvl
具体包的安装暂且跳过，我们核心讲下载数据集的部分
二：配置huggingface环境
这里有非常多的版本，有用脚本的，有用Python的，还有用CLI，这里我只推荐一个 hfd （足足浪费了两天时间）
首先下载
wget &lt;a href=&#34;https://hf-mirror.com/hfd/hfd.sh&#34;&gt;https://hf-mirror.com/hfd/hfd.sh&lt;/a&gt;
chmod a+x hfd.sh
安装hfd.sh依赖（aria2c）
apt update &amp;amp;&amp;amp; apt install -y aria2
设置环境变量
export HF_ENDPOINT=https://hf-mirror.com&lt;/p&gt;
&lt;p&gt;最关键的一步，加速! (16线程+分块下载)
export HFD_DOWNLOADER=&amp;ldquo;aria2c -x 16 -s 16 -k 1M&amp;rdquo;&lt;/p&gt;
&lt;p&gt;三：下载数据集（下载模型也同理）
这里我以我下载的数据集为例：
执行hfd.sh下载LLaVA-Pretrain数据集
/root/autodl-tmp/DiffusionVL/data/hfd.sh liuhaotian/LLaVA-Pretrain &amp;ndash;dataset \ &amp;ndash;local-dir /root/autodl-tmp/DiffusionVL/data/LLaVA-Pretrain&lt;/p&gt;
&lt;p&gt;前面是我下载的地址hfd.sh ，中间为数据集的名字，后面是我要下载数据集的位置（当然可以直接丢给gpt，告诉它仿照这一行命令）&lt;/p&gt;
&lt;p&gt;如果中间碰到什么问题，可以关掉窗口，再次执行这个命令，可以断点续传&lt;/p&gt;
&lt;p&gt;解压
unzip -q /root/autodl-tmp/DiffusionVL/data/LLaVA-Pretrain/images.zip \ -d /root/autodl-tmp/DiffusionVL/data/LLaVA-Pretrain/images&lt;/p&gt;
&lt;p&gt;&lt;img loading=&#34;lazy&#34; src=&#34;https://syl.moe5200.com/posts/engineering/autodl-hf-download-hfd/file-20260309221335909.jpg&#34;&gt;&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
