薪科技快评

获赞0
文章
67
评论
28
  • 浅谈容器网络原理我们将深入探讨容器和Kubernetes的网络原理,以全面了解KubernetesNetwork的Service。这些知识将帮助您轻松理解和使用Service。容器技术充分利用Linux的原生功能,如命名空间隔离、cgrou
    薪科技快评7月前
    930
  • 大模型剪枝概述近年来,Transformer和MOE架构的崛起,推动了深度学习模型参数规模的飙升,轻松突破上万亿。面对模型日益庞大的挑战,大模型压缩技术应运而生。该技术旨在降低模型部署成本,提升推理性能。主要压缩方法包括剪枝、量化、知识蒸馏
    薪科技快评7月前
    830
  • 英伟达Blackwell平台网络配置详解AI算力研究:英伟达B200再创算力奇迹,液冷、光模块持续革新突破性的GB200NVL72全互联架构,带来高性能GPU解决方案。铜缆方案有望成为未来趋势,提供低成本、高带宽连接。1.Blackwell
    薪科技快评7月前
    970
  • 英伟达NVLink技术深度分析NVLink,NVIDIA专属互连技术,在HPC和AI领域举足轻重。NVLink解决方案包括NVSwitch芯片、NVLink服务器和交换机,可实现多GPU系统的高带宽、低延迟通信。凭借每秒300GB的双向数据
    薪科技快评7月前
    1010
  • 高性能GPU服务器硬件拓扑与集群组网01、术语与基础大模型训练采用集群式架构,每台主机配备8块高性能GPU,包括A100、A800、H100、H800四种机型。其中,典型8*A100GPU主机内部硬件架构如下:|典型8卡A100主机硬件拓扑
    薪科技快评7月前
    1330
  • NVIDIAGPU架构梳理近期深入研究并行计算,需探究底层硬件精髓。高性能计算界,英伟达显卡稳居霸主地位。本文旨在梳理NVIDIAGPU架构之演进历程,助您洞悉其技术脉络,把握未来计算趋势。目录:NVIDIAGPU架构历经数次革新:从Tes
    薪科技快评7月前
    660
  • 浅谈NvidiaH20的实用价值一、引言站在这个时间点上看,2024年国内通过合规渠道能采购的英伟达的高端显卡只有H20[1,2]。NvidiaH20拥有高配的显存、很高的卡间互联带宽和有竞争力的FP8算力,是值得推荐的一款GPU卡(单看9
    薪科技快评7月前
    1250
  • AI大模型推理过程和优化技术一推理过程主流大模型均根植于Transformer架构,其核心精髓在于注意力机制。简而言之,该机制通过计算softmax(qk^T)*v,精准捕捉数据间的关联,从而实现高效信息处理。计算softmax(qk^T)
    薪科技快评7月前
    1120
  • 企业构建和采购生成式AI方面的16项改变生成式AI领域趋势洞察:企业构建和采购生成式AI的方式正在发生重大转变,具体表现在:*专注于可信度和安全性:75%的企业将信任和安全性视为关键因素。*优先考虑可扩展性和灵活性:65%的企业寻求具有高可
    薪科技快评7月前
    530
  • AI芯片激战正酣!Meta震撼发布全新AI推理芯片,性能飙升300%,强效支撑Llama高负荷运算,引领行业新潮流!微软去年便宣布,采用台积电尖端的5nm技术,成功打造AzureMaia100与AzureCobalt100芯片,引领行业创新
    薪科技快评7月前
    750
  • 全网最全网络基础思维导图(38张)掌握计算机网络基础知识,38张思维导图助你轻松掌握!思维导图系统整理要点,高效理清思路,快速获取关键内容。收藏研读,动手重画,让知识深度连接,构建网络知识体系。01TCP/IP网络协议栈02TCP/IP协议
    薪科技快评7月前
    650
  • 一颗万能的RISC-V芯片:将CPU和GPU整合到一个核中X-Silicon推出创新的RISC-V芯片架构,将CPU、矢量功能和GPU加速无缝集成。这种开源混合芯片专为多功能工作负载而设计,包括人工智能,旨在通过高效处理提升性能。革命性的C
    薪科技快评7月前
    1330
  • 国内算力:昇腾一马当先,各家竞相发展昇腾智算领航,国内市占率高达79%!目前已大规模部署于华为云和全国28个城市的智能算力中心,赋能各行业智慧升级。AI算力行业浪潮汹涌,势不可挡。相比于拥有千亿参数的GPT-3.5,GPT-4参数规模达万亿
    薪科技快评7月前
    1250
  • 如何解决GPU万卡互联的挑战近日,字节跳动携手北京大学研究团队发布重磅论文,揭示了一项革命性技术:将大型语言模型训练扩展至超10,000块GPU的生产系统。此系统不仅解决了万卡集群训练大模型时的效率和稳定性难题,更标志着人工智能领域的一大步
    薪科技快评7月前
    1390
  • 生成式AI领域趋势洞察:企业构建和采购生成式AI的方式正在发生重大转变,具体表现在:*专注于可信度和安全性:75%的企业将信任和安全性视为关键因素。*优先考虑可扩展性和灵活性:65%的企业寻求具有高可扩展性和灵活性的解决方案。*投资于自动化
    薪科技快评7月前
    1200
  • 随着交换芯片带宽的持续提升,其内部数据包处理单元的工作负载也随之增加。然而,如果处理单元无法与网络接口的传入速率相匹配,将无法及时处理数据包,这不仅会导致数据包随机丢失,更会降低网络的吞吐量。本文将深入探讨与数据包处理相关的各项工作和挑战,
    薪科技快评7月前
    1100
  • NVMeSSD性能影响因素NVMeSSD厂商Spec给出的性能非常完美,前面也给出了NVMeSSD和磁盘之间的性能对比,NVMeSSD的性能的确比磁盘高很多。但在实际应用过程中,NVMeSSD的性能可能没有想象中的那么好,并且看上去不是特别
    薪科技快评7月前
    1270
  • 卷积神经网络(CNN),又称ConvNet,是一种强大的深度学习模型,专用于处理网格状数据。CNN擅长识别图像(二维数据)和时间序列(一维数据)中的模式。通过应用一系列卷积和池化层,CNN可以提取数据中的局部特征,并在更大范围内构建更高级别
    薪科技快评7月前
    1330
  • InfiniBand与RoCE对比分析:AI数据中心网络选择指南随着人工智能(AI)蓬勃发展,数据中心基础设施必须应对高带宽和低延迟网络以支持其尖端应用,包括自然语言处理、计算机视觉和自动驾驶。低延迟、高吞吐量网络对于高效处理复杂、数据密集
    薪科技快评7月前
    1110
  • NVIDIA大语言模型落地的全流程解析导读本文将分享NVIDIA在大语言模型领域的解决方案。包括三部分内容:NeMoFramework,NVIDIA的大语言模型全栈解决方案,赋能生成式AI各阶段:*数据预处理*分布式训练*模型微调*模型推理
    薪科技快评7月前
    1230