<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Engineering on 33</title>
    <link>https://syl.moe5200.com/categories/engineering/</link>
    <description>Recent content in Engineering on 33</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <copyright>2026 33</copyright>
    <lastBuildDate>Sun, 28 Jun 2026 02:30:00 +0000</lastBuildDate>
    <atom:link href="https://syl.moe5200.com/categories/engineering/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>AutoDL 下载 HF 数据集配置环境一次性跑通！稳定 15MB&#43;</title>
      <link>https://syl.moe5200.com/posts/engineering/autodl-hf-download-hfd/</link>
      <pubDate>Sun, 28 Jun 2026 02:30:00 +0000</pubDate>
      <guid>https://syl.moe5200.com/posts/engineering/autodl-hf-download-hfd/</guid>
      <description>&lt;p&gt;在AutoDL的服务器上，我在下载数据集和模型权重的时候踩了特别多的坑。
我尝试用过云盘传
也试过下载在本地，再通过服务器上传
全部都失败了！不是上传特别慢就是数据集太多，太散，太难传。
最后，我找到了解决方法的最终版本，下载速度稳定15MB+&lt;/p&gt;
&lt;p&gt;一：创建conda环境
conda create -n diffusionvl python=3.10 -y
conda activate diffusionvl
具体包的安装暂且跳过，我们核心讲下载数据集的部分
二：配置huggingface环境
这里有非常多的版本，有用脚本的，有用Python的，还有用CLI，这里我只推荐一个 hfd （足足浪费了两天时间）
首先下载
wget &lt;a href=&#34;https://hf-mirror.com/hfd/hfd.sh&#34;&gt;https://hf-mirror.com/hfd/hfd.sh&lt;/a&gt;
chmod a+x hfd.sh
安装hfd.sh依赖（aria2c）
apt update &amp;amp;&amp;amp; apt install -y aria2
设置环境变量
export HF_ENDPOINT=https://hf-mirror.com&lt;/p&gt;
&lt;p&gt;最关键的一步，加速! (16线程+分块下载)
export HFD_DOWNLOADER=&amp;ldquo;aria2c -x 16 -s 16 -k 1M&amp;rdquo;&lt;/p&gt;
&lt;p&gt;三：下载数据集（下载模型也同理）
这里我以我下载的数据集为例：
执行hfd.sh下载LLaVA-Pretrain数据集
/root/autodl-tmp/DiffusionVL/data/hfd.sh liuhaotian/LLaVA-Pretrain &amp;ndash;dataset \ &amp;ndash;local-dir /root/autodl-tmp/DiffusionVL/data/LLaVA-Pretrain&lt;/p&gt;
&lt;p&gt;前面是我下载的地址hfd.sh ，中间为数据集的名字，后面是我要下载数据集的位置（当然可以直接丢给gpt，告诉它仿照这一行命令）&lt;/p&gt;
&lt;p&gt;如果中间碰到什么问题，可以关掉窗口，再次执行这个命令，可以断点续传&lt;/p&gt;
&lt;p&gt;解压
unzip -q /root/autodl-tmp/DiffusionVL/data/LLaVA-Pretrain/images.zip \ -d /root/autodl-tmp/DiffusionVL/data/LLaVA-Pretrain/images&lt;/p&gt;
&lt;p&gt;&lt;img loading=&#34;lazy&#34; src=&#34;https://syl.moe5200.com/posts/engineering/autodl-hf-download-hfd/file-20260309221335909.jpg&#34;&gt;&lt;/p&gt;</description>
    </item>
    <item>
      <title>万字长文吐血整理：深度学习环境搭建笔记</title>
      <link>https://syl.moe5200.com/posts/engineering/deep-learning-environment-setup/</link>
      <pubDate>Sun, 28 Jun 2026 02:30:00 +0000</pubDate>
      <guid>https://syl.moe5200.com/posts/engineering/deep-learning-environment-setup/</guid>
      <description>&lt;p&gt;环境作为一个新手劝退，老手浪费时间的东西
就算已经完全熟练配置环境也会遇到各种问题&lt;/p&gt;
&lt;p&gt;本人短时间内经历了笔记本/服务器等四到五次完整环境的搭建，从CUDA torch版本不适配-到数据集/模型太大上传太慢，再到没有科学上网安装不了git包等等各种问题
每次配置环境都需要花费3-4个小时的时间，为避免后续再次浪费时间（和算力）整理了自己学习以来配置环境的经验
个人感觉还是涵盖了大部分情况的，后续有新的方法会继续更新笔记，如有好的方法虚心求教~&lt;/p&gt;
&lt;h2 id=&#34;通用&#34;&gt;通用&lt;/h2&gt;
&lt;p&gt;一&amp;raquo;初始配置
配置CUDA
配置显卡驱动
配置miniconda/miniforge3/anconda（这里推荐miniconda）
配置清华源（如果apt更新慢这里也可以配置清华源）
创建conda环境&lt;/p&gt;
&lt;p&gt;二&amp;raquo;配置conda环境/UV环境
1：对于复现论文/复现别人项目
在pyproject.toml中将与torch相关的注释掉
根据自身CUDA版本安装torch
（50系显卡使用cu128）
根据你的项目pip install -e .
跑训练/推理脚本 缺什么补什么
2：对于自己的项目
根据自身CUDA版本安装torch
（50系显卡使用cu128）
用什么安装什么
三&amp;raquo;&amp;gt;下载数据集/模型
统一推荐使用hfd镜像+aria2c下载，速度能稳定15MB跑满带宽
其他的方式都尝试过，最终不如这个
wget hfd.sh下载脚本
sudo apt install aria2
chmod a+x hfd.sh
export HF_ENDPOINT=镜像网站
export HFD_DOWNLOADER=&amp;ldquo;aria2c -x 16 -s 16 -k 1M&amp;rdquo;
你的脚本地址  下载模型/数据集参数  下载地址&lt;/p&gt;
&lt;h2 id=&#34;服务器&#34;&gt;服务器&lt;/h2&gt;
&lt;p&gt;对于服务器，优先在本地做好代码和环境，后续直接打包上传，也可以镜像整体迁移
1：本地-&amp;gt;服务器
1使用filezilla等SFTP协议的上传工具，注意使用高宽带网络（热点）校园网慢点
2将所有的代码上传，不要上传数据集/模型权重
3数据集/模型权重直接使用通用里面的下载命令下载到服务器（上传会慢）
4配置conda环境
2：直接服务器（没有魔法的话）
1先在本地git clone好，然后上传
2在本地下载好魔法安装不了的环境，然后上传服务器安装
2下载数据集/模型权重
3配置conda环境&lt;/p&gt;
&lt;h2 id=&#34;常见问题解决&#34;&gt;常见问题解决&lt;/h2&gt;
&lt;p&gt;1：GPU无法使用—&amp;gt;torch版本不对
print(torch.cuda.is_available())确定能不能使用
记住自己是什么torch版本，配置环境先配置好torch
2：下载速度巨慢/连接超时！！！
对于模型/数据集：使用我上述的方法
对于环境包：配置清华源，不行使用aria2c下载安装，再不行找一个有魔法的机子再上传
3：版本不适配/报错
根据自己的项目先确定好自己到底要用什么！
不要后面不断改把环境搞脏了
先确定好环境-针对能改的包进行更新
每次环境跑通后，记录：
pip freeze &amp;gt; requirements_freeze.txt
conda env export &amp;gt; environment.yaml
4：&lt;/p&gt;</description>
    </item>
    <item>
      <title>网站动态能力测试</title>
      <link>https://syl.moe5200.com/posts/engineering/dynamic-features-demo/</link>
      <pubDate>Sat, 27 Jun 2026 17:00:00 +0000</pubDate>
      <guid>https://syl.moe5200.com/posts/engineering/dynamic-features-demo/</guid>
      <description>&lt;p&gt;这篇文章用于测试站点增强功能：文章目录、代码复制、图片放大、Mermaid 图表和 LaTeX 数学公式。&lt;/p&gt;
&lt;h2 id=&#34;代码复制&#34;&gt;代码复制&lt;/h2&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-python&#34; data-lang=&#34;python&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;def&lt;/span&gt; &lt;span style=&#34;color:#a6e22e&#34;&gt;hello_site&lt;/span&gt;(name: str) &lt;span style=&#34;color:#f92672&#34;&gt;-&amp;gt;&lt;/span&gt; str:
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#66d9ef&#34;&gt;return&lt;/span&gt; &lt;span style=&#34;color:#e6db74&#34;&gt;f&lt;/span&gt;&lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;Hello, &lt;/span&gt;&lt;span style=&#34;color:#e6db74&#34;&gt;{&lt;/span&gt;name&lt;span style=&#34;color:#e6db74&#34;&gt;}&lt;/span&gt;&lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h2 id=&#34;mermaid-图表&#34;&gt;Mermaid 图表&lt;/h2&gt;
&lt;div class=&#34;mermaid&#34;&gt;
flowchart LR
    A[写 Markdown] --&amp;gt; B[Hugo 构建]
    B --&amp;gt; C[Nginx 发布]
    C --&amp;gt; D[HTTPS 访问]
&lt;/div&gt;
&lt;h2 id=&#34;latex-数学公式&#34;&gt;LaTeX 数学公式&lt;/h2&gt;
&lt;p&gt;行内公式：$E = mc^2$&lt;/p&gt;
&lt;p&gt;块级公式：&lt;/p&gt;
$$
\mathcal{L}(\theta) = - \sum_{i=1}^{n} y_i \log p_\theta(x_i)
$$</description>
    </item>
    <item>
      <title>Engineering 工程笔记</title>
      <link>https://syl.moe5200.com/posts/engineering/overview/</link>
      <pubDate>Sat, 27 Jun 2026 00:00:00 +0000</pubDate>
      <guid>https://syl.moe5200.com/posts/engineering/overview/</guid>
      <description>&lt;p&gt;这个栏目用于记录工程实践，包括服务器配置、部署流程、自动化脚本和日常工具链。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
