• 设为首页
  • 收藏本站
  • 积分充值
  • VIP赞助
  • 手机版
  • 微博
  • 微信
    微信公众号 添加方式:
    1:搜索微信号(888888
    2:扫描左侧二维码
  • 快捷导航
    福建二哥 门户 查看主题

    华为昇腾920b服务器部署DeepSeek翻车现场演示

    发布者: 晋3555 | 发布时间: 2025-8-16 11:02| 查看数: 38| 评论数: 0|帖子模式

    最近到祸一台HUAWEI Kunpeng 920 5250,先看看配置。之前是部署的讯飞大模型,发现资源利用率太低了。把5台减少到3台,就出了他

    硬件配置信息


    基本硬件信息

    按照惯例先来看看配置。一共3块盘,500G的系统盘,+ 2块3T固态,后面把固态硬盘也组合成了逻辑卷
    内存是1.5T的,比我电脑硬盘都大
    1. [root@localhost ~]# lsblk
    2. NAME                    MAJ:MIN RM   SIZE RO TYPE MOUNTPOINTS
    3. sda                       8:0    0 446.6G  0 disk
    4. ├─sda1                    8:1    0   600M  0 part /boot/efi
    5. ├─sda2                    8:2    0     1G  0 part /boot
    6. └─sda3                    8:3    0   445G  0 part
    7.   ├─openeuler-root      253:0    0    70G  0 lvm  /
    8.   ├─openeuler-swap      253:1    0     4G  0 lvm  [SWAP]
    9.   └─openeuler-home      253:2    0   371G  0 lvm  /home
    10. nvme1n1                 259:0    0   2.9T  0 disk
    11. └─nvme1n1p1             259:4    0   2.9T  0 part
    12.   └─vg_data01-lv_data01 253:3    0   5.8T  0 lvm  /data
    13. nvme0n1                 259:1    0   2.9T  0 disk
    14. └─nvme0n1p1             259:3    0   2.9T  0 part
    15.   └─vg_data01-lv_data01 253:3    0   5.8T  0 lvm  /data
    16. [root@localhost ~]# df -Th | awk '$2 !~ /overlay/ && $2 !~ /tmpfs/'
    17. 文件系统                        类型      容量  已用  可用 已用% 挂载点
    18. /dev/mapper/openeuler-root      ext4       69G   45G   21G   69% /
    19. /dev/sda2                       ext4      974M   72M  835M    8% /boot
    20. /dev/sda1                       vfat      599M  5.8M  594M    1% /boot/efi
    21. /dev/mapper/openeuler-home      ext4      365G  4.6G  342G    2% /home
    22. /dev/mapper/vg_data01-lv_data01 ext4      5.8T  4.3T  1.3T   78% /data
    复制代码
    1. [root@localhost ~]# cat /etc/os-release
    2. NAME="openEuler"
    3. VERSION="22.03 LTS"
    4. ID="openEuler"
    5. VERSION_ID="22.03"
    6. PRETTY_NAME="openEuler 22.03 LTS"
    7. ANSI_COLOR="0;31"
    8. [root@localhost ~]# uname -a
    9. Linux localhost.localdomain 5.10.0-60.18.0.50.oe2203.aarch64 #1 SMP Wed Mar 30 02:43:08 UTC 2022 aarch64 aarch64 aarch64 GNU/Linux
    10. [root@localhost ~]# lscpu
    11. 架构:               aarch64
    12.   CPU 运行模式:     64-bit
    13.   字节序:           Little Endian
    14. CPU:                 192
    15.   在线 CPU 列表:    0-191
    16. 厂商 ID:            HiSilicon
    17.   BIOS Vendor ID:    HiSilicon
    18.   型号名称:         Kunpeng-920
    19.     BIOS Model name: HUAWEI Kunpeng 920 5250
    20.     型号:           0
    21.     每个核的线程数: 1
    22.     每个座的核数:   48
    23.     座:             4
    24.     步进:           0x1
    25.     Frequency boost: disabled
    26.     CPU 最大 MHz:   2600.0000
    27.     CPU 最小 MHz:   200.0000
    28.     BogoMIPS:       200.00
    29.     标记:           fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp cpuid asimdrdm jscvt fcma dcpop asimddp asimdfhm ssbs
    30. Caches (sum of all):
    31.   L1d:               12 MiB (192 instances)
    32.   L1i:               12 MiB (192 instances)
    33.   L2:                96 MiB (192 instances)
    34.   L3:                192 MiB (8 instances)
    35. NUMA:               
    36.   NUMA 节点:        8
    37.   NUMA 节点0 CPU:   0-23
    38.   NUMA 节点1 CPU:   24-47
    39.   NUMA 节点2 CPU:   48-71
    40.   NUMA 节点3 CPU:   72-95
    41.   NUMA 节点4 CPU:   96-119
    42.   NUMA 节点5 CPU:   120-143
    43.   NUMA 节点6 CPU:   144-167
    44.   NUMA 节点7 CPU:   168-191
    45. Vulnerabilities:     
    46.   Itlb multihit:     Not affected
    47.   L1tf:              Not affected
    48.   Mds:               Not affected
    49.   Meltdown:          Not affected
    50.   Spec store bypass: Mitigation; Speculative Store Bypass disabled via prctl
    51.   Spectre v1:        Mitigation; __user pointer sanitization
    52.   Spectre v2:        Not affected
    53.   Srbds:             Not affected
    54.   Tsx async abort:   Not affected
    55. [root@localhost ~]# free -h
    56.                total        used        free      shared  buff/cache   available
    57. Mem:           1.5Ti        12Gi        26Gi        20Mi       1.4Ti       1.5Ti
    58. Swap:          4.0Gi        12Mi       4.0Gi
    复制代码

    NPU/GPU信息

    由于没有部署任何AI、模型,所以空载着
    1. [root@localhost ~]# npu-smi info
    2. +------------------------------------------------------------------------------------------------+
    3. | npu-smi 24.1.rc1                 Version: 24.1.rc1                                             |
    4. +---------------------------+---------------+----------------------------------------------------+
    5. | NPU   Name                | Health        | Power(W)    Temp(C)           Hugepages-Usage(page)|
    6. | Chip                      | Bus-Id        | AICore(%)   Memory-Usage(MB)  HBM-Usage(MB)        |
    7. +===========================+===============+====================================================+
    8. | 0     910B3               | OK            | 89.7        35                0    / 0             |
    9. | 0                         | 0000:C1:00.0  | 0           0    / 0          3159 / 65536         |
    10. +===========================+===============+====================================================+
    11. | 1     910B3               | OK            | 88.6        38                0    / 0             |
    12. | 0                         | 0000:C2:00.0  | 0           0    / 0          3159 / 65536         |
    13. +===========================+===============+====================================================+
    14. | 2     910B3               | OK            | 91.8        36                0    / 0             |
    15. | 0                         | 0000:81:00.0  | 0           0    / 0          3159 / 65536         |
    16. +===========================+===============+====================================================+
    17. | 3     910B3               | OK            | 87.2        36                0    / 0             |
    18. | 0                         | 0000:82:00.0  | 0           0    / 0          3159 / 65536         |
    19. +===========================+===============+====================================================+
    20. | 4     910B3               | OK            | 88.8        41                0    / 0             |
    21. | 0                         | 0000:01:00.0  | 0           0    / 0          3159 / 65536         |
    22. +===========================+===============+====================================================+
    23. | 5     910B3               | OK            | 95.7        44                0    / 0             |
    24. | 0                         | 0000:02:00.0  | 0           0    / 0          3159 / 65536         |
    25. +===========================+===============+====================================================+
    26. | 6     910B3               | OK            | 93.5        39                0    / 0             |
    27. | 0                         | 0000:41:00.0  | 0           0    / 0          3160 / 65536         |
    28. +===========================+===============+====================================================+
    29. | 7     910B3               | OK            | 89.2        40                0    / 0             |
    30. | 0                         | 0000:42:00.0  | 0           0    / 0          3160 / 65536         |
    31. +===========================+===============+====================================================+
    32. +---------------------------+---------------+----------------------------------------------------+
    33. | NPU     Chip              | Process id    | Process name             | Process memory(MB)      |
    34. +===========================+===============+====================================================+
    35. | No running processes found in NPU 0                                                            |
    36. +===========================+===============+====================================================+
    37. | No running processes found in NPU 1                                                            |
    38. +===========================+===============+====================================================+
    39. | No running processes found in NPU 2                                                            |
    40. +===========================+===============+====================================================+
    复制代码

    开始部署DeepSeek


    ollama方法

    根据网上资料看,只要用ollama部署就行,后面发现这个行不通。因为ollama只适配了英伟达的GPU,像华为的根本就行不通啊,
    ollama的安装脚本也是去下载英伟达的驱动,结果就是下载失败,就算下载成功了也不能安装上去
    https://zhuanlan.zhihu.com/p/22081569918
    0
    最后折腾了很久

    使用 nohup ollama run

    部署一个1.5B的试试,发现可以运行了。但是总觉得不对境。回答问题太慢了,用时3分钟。CPU使用率也是狂飙。NPU是一点没有使上劲啊
    1. ollama run deepseek-r1:1.5b
    复制代码


    容器部署方法

    最后决定下载权重+容器部署。结果这里就有遇到了坑点
    需要用到git lfs 工具 和 华为的镜像。因为这是ARM服务器,所有git lfs命令也很难找,欧拉的yum源还没有提供,最后翻来覆去在github最新的V3.6.1找到了。使用二进制命令接安装脚本既可以实现。这样就能通过git install ,git push 去拉取近1TB的权重了
    https://github.com/git-lfs/git-lfs/releases


    再说说这个华为的镜像吧,不得不吐槽。华为这是把镜像当宝贝供着吗,下载还需要申请权限,不是一般人还申请不下来。还好我们这里条件都满足
    晚上提交的申请,第二天早上就通过了

    最后参照了好几个教程,不是启动失败,就吃出现权限拒绝,服了
    华为服务器社区:https://www.hiascend.com/software/modelzoo/models/detail/68457b8a51324310aad9a0f55c3e56e3
    天翼云社区: https://www.ctyun.cn/document/10027724/10944583


    部署R1模型提示不兼容…
    天翼云社区: https://www.ctyun.cn/document/10027724/10944583

    部署R1模型提示不兼容…
    到此这篇关于华为昇腾920b服务器部署DeepSeek翻车现场演示的文章就介绍到这了,更多相关昇腾920b服务器部署DeepSeek内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

    来源:互联网
    免责声明:如果侵犯了您的权益,请联系站长(1277306191@qq.com),我们会及时删除侵权内容,谢谢合作!

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?立即注册

    ×

    最新评论

    浏览过的版块

    QQ Archiver 手机版 小黑屋 福建二哥 ( 闽ICP备2022004717号|闽公网安备35052402000345号 )

    Powered by Discuz! X3.5 © 2001-2023

    快速回复 返回顶部 返回列表