薪科技快评 - 主题

Kubernetes 容器网络技术架构及原理分析, 赋能数字化转型
浅谈容器网络原理我们将深入探讨容器和Kubernetes的网络原理，以全面了解KubernetesNetwork的Service。这些知识将帮助您轻松理解和使用Service。容器技术充分利用Linux的原生功能，如命名空间隔离、cgrou
薪科技快评7月前
930
一文读懂大模型剪枝: 轻量级AI如何领跑未来科技
大模型剪枝概述近年来，Transformer和MOE架构的崛起，推动了深度学习模型参数规模的飙升，轻松突破上万亿。面对模型日益庞大的挑战，大模型压缩技术应运而生。该技术旨在降低模型部署成本，提升推理性能。主要压缩方法包括剪枝、量化、知识蒸馏
薪科技快评7月前
830
揭秘英伟达Blackwell平台网络拓扑架构, 解锁超算新境界
英伟达Blackwell平台网络配置详解AI算力研究：英伟达B200再创算力奇迹，液冷、光模块持续革新突破性的GB200NVL72全互联架构，带来高性能GPU解决方案。铜缆方案有望成为未来趋势，提供低成本、高带宽连接。1.Blackwell
薪科技快评7月前
970
解密英伟达NVLink: 解锁多GPU计算的无限潜力
英伟达NVLink技术深度分析NVLink，NVIDIA专属互连技术，在HPC和AI领域举足轻重。NVLink解决方案包括NVSwitch芯片、NVLink服务器和交换机，可实现多GPU系统的高带宽、低延迟通信。凭借每秒300GB的双向数据
薪科技快评7月前
1010
高性能GPU服务器集群拓扑及组网方案
高性能GPU服务器硬件拓扑与集群组网01、术语与基础大模型训练采用集群式架构，每台主机配备8块高性能GPU，包括A100、A800、H100、H800四种机型。其中，典型8*A100GPU主机内部硬件架构如下：|典型8卡A100主机硬件拓扑
薪科技快评7月前
1330
NVIDIA全系列GPU技术路线演进分析
NVIDIAGPU架构梳理近期深入研究并行计算，需探究底层硬件精髓。高性能计算界，英伟达显卡稳居霸主地位。本文旨在梳理NVIDIAGPU架构之演进历程，助您洞悉其技术脉络，把握未来计算趋势。目录：NVIDIAGPU架构历经数次革新：从Tes
薪科技快评7月前
660
揭秘Nvidia H20: 实用价值与未来趋势的双重解读
浅谈NvidiaH20的实用价值一、引言站在这个时间点上看，2024年国内通过合规渠道能采购的英伟达的高端显卡只有H20[1,2]。NvidiaH20拥有高配的显存、很高的卡间互联带宽和有竞争力的FP8算力，是值得推荐的一款GPU卡（单看9
薪科技快评7月前
1250
揭秘AI大模型: 推理过程优化如何影响未来智能世界?
AI大模型推理过程和优化技术一推理过程主流大模型均根植于Transformer架构，其核心精髓在于注意力机制。简而言之，该机制通过计算softmax(qk^T)*v，精准捕捉数据间的关联，从而实现高效信息处理。计算softmax(qk^T)
薪科技快评7月前
1120
解锁生成式 AI 的力量: a16z 提供的 16 个企业指南
企业构建和采购生成式AI方面的16项改变生成式AI领域趋势洞察：企业构建和采购生成式AI的方式正在发生重大转变，具体表现在：*专注于可信度和安全性：75%的企业将信任和安全性视为关键因素。*优先考虑可扩展性和灵活性：65%的企业寻求具有高可
薪科技快评7月前
530
Meta发布全新AI推理芯片, 性能飙升3倍, 强效支撑Llama高负荷运算
AI芯片激战正酣！Meta震撼发布全新AI推理芯片，性能飙升300%，强效支撑Llama高负荷运算，引领行业新潮流！微软去年便宣布，采用台积电尖端的5nm技术，成功打造AzureMaia100与AzureCobalt100芯片，引领行业创新
薪科技快评7月前
750
全网最全38张神级网络基础思维导图
全网最全网络基础思维导图（38张）掌握计算机网络基础知识，38张思维导图助你轻松掌握！思维导图系统整理要点，高效理清思路，快速获取关键内容。收藏研读，动手重画，让知识深度连接，构建网络知识体系。01TCP/IP网络协议栈02TCP/IP协议
薪科技快评7月前
650
RISC-V技术变革: 一颗芯片, CPU与GPU合二为一
一颗万能的RISC-V芯片:将CPU和GPU整合到一个核中X-Silicon推出创新的RISC-V芯片架构，将CPU、矢量功能和GPU加速无缝集成。这种开源混合芯片专为多功能工作负载而设计，包括人工智能，旨在通过高效处理提升性能。革命性的C
薪科技快评7月前
1330
国产算力崛起: 昇腾一骑绝尘, 群雄争锋
国内算力：昇腾一马当先，各家竞相发展昇腾智算领航，国内市占率高达79%！目前已大规模部署于华为云和全国28个城市的智能算力中心，赋能各行业智慧升级。AI算力行业浪潮汹涌，势不可挡。相比于拥有千亿参数的GPT-3.5，GPT-4参数规模达万亿
薪科技快评7月前
1250
大模型训练: 如何解决GPU万卡互联挑战?
如何解决GPU万卡互联的挑战近日，字节跳动携手北京大学研究团队发布重磅论文，揭示了一项革命性技术：将大型语言模型训练扩展至超10,000块GPU的生产系统。此系统不仅解决了万卡集群训练大模型时的效率和稳定性难题，更标志着人工智能领域的一大步
薪科技快评7月前
1390
解锁生成式 AI 的力量: 为企业提供的 16 个实践指南
生成式AI领域趋势洞察：企业构建和采购生成式AI的方式正在发生重大转变，具体表现在：*专注于可信度和安全性：75%的企业将信任和安全性视为关键因素。*优先考虑可扩展性和灵活性：65%的企业寻求具有高可扩展性和灵活性的解决方案。*投资于自动化
薪科技快评7月前
1200
深度探索高端“交换芯片”的技术奥秘
随着交换芯片带宽的持续提升，其内部数据包处理单元的工作负载也随之增加。然而，如果处理单元无法与网络接口的传入速率相匹配，将无法及时处理数据包，这不仅会导致数据包随机丢失，更会降低网络的吞吐量。本文将深入探讨与数据包处理相关的各项工作和挑战，
薪科技快评7月前
1100
提升NVMe SSD速度: 破解性能瓶颈的秘诀
NVMeSSD性能影响因素NVMeSSD厂商Spec给出的性能非常完美，前面也给出了NVMeSSD和磁盘之间的性能对比，NVMeSSD的性能的确比磁盘高很多。但在实际应用过程中，NVMeSSD的性能可能没有想象中的那么好，并且看上去不是特别
薪科技快评7月前
1270
探索卷积神经网络CNN, 解锁图像处理的宝库
卷积神经网络(CNN)，又称ConvNet，是一种强大的深度学习模型，专用于处理网格状数据。CNN擅长识别图像（二维数据）和时间序列（一维数据）中的模式。通过应用一系列卷积和池化层，CNN可以提取数据中的局部特征，并在更大范围内构建更高级别
薪科技快评7月前
1330
揭秘InfiniBand与RoCE: AI数据中心选择最佳网络
InfiniBand与RoCE对比分析：AI数据中心网络选择指南随着人工智能(AI)蓬勃发展，数据中心基础设施必须应对高带宽和低延迟网络以支持其尖端应用，包括自然语言处理、计算机视觉和自动驾驶。低延迟、高吞吐量网络对于高效处理复杂、数据密集
薪科技快评7月前
1110
揭秘大语言模型落地的全流程
NVIDIA大语言模型落地的全流程解析导读本文将分享NVIDIA在大语言模型领域的解决方案。包括三部分内容：NeMoFramework，NVIDIA的大语言模型全栈解决方案，赋能生成式AI各阶段：*数据预处理*分布式训练*模型微调*模型推理
薪科技快评7月前
1230