一句话概括的大模型本质，萌新也能听懂！

卷王只爱摸鱼2024-05-02 10:29:44 119

hello小伙伴们~不要担心大模型学不懂，一句话可以简单概括：大模型的工作方式，已经接近一种压缩算法。 . 把海量的文本压缩成一个代码文件+一个模型文件，靠这两个东西调动机器资源去解压缩（也因为如此，你的显存要足够大，因为模型文件要在gpu里解压缩）。 . 它接近在一个压缩文件里去搜索可能的答案。 . 所以呢，你提问它，需要它以前压缩过相关文本数据，并且最好要比较多次，否则就会出现幻觉。 . 什么？你可能会问了，大模型不是靠transformer这种神经网络正反向传播训练来实现的吗？模型架构呢，qkv呢，多头呢，归一化呢，激活呢，残差连接呢，博主是不是半桶水，你是不是不懂哈！！ . 是这样的哈，那是实现方式，学习一个东西不要彻底陷入细节中，我们要从本质上去理解问题~神经网络从统计学来说，类似于从数据空间中搜索和输入最匹配的数据作为输出~

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/414547.html

随机主题

墨西哥一场总统竞选活动发生舞台倒塌事故数十人死伤降价就会冲的小米手机, 很多人直接选了这两款, 小米13Ultra在内娶过三个老婆的五位男明星汪小菲状告大S 曝森林北爱上汪峰损失大, 活动被取消, 阳光清纯遭质疑, 但不后悔末节15分&一断一投收比赛! Skip: 东契奇打得像世界最佳球员比亚迪“廉价腾势D9”要来了, 中大型MPV, 或20多万级!五款车选谁毛病少? 星瑞、思域、凌度、艾瑞泽8、朗逸故障率横比落地还不到10万, 这三款合资车值得买, 三大件稳定, 开20年不用修郭虹：演技深厚获认可拜登不满国际刑事法院，扎哈罗娃嘲讽：“陷入自己网中的蜘蛛”红米Turbo3直降300元？1699告诉你什么叫“生死看淡，不服就干”穆帅盛赞优秀的“板凳匪徒们”冯劲: 靠努力把握机会 6月30截止! Shams: 詹姆斯执行/拒绝球员选项两种方案都在讨论中新趋势！北青：伊万征调多名跑动能力和身体条件俱佳的国脚！《庆余年2》范闲的底牌上线, 原著中最强卧底!前央视主持离世, 曾解说中国女排夺冠成名, 与郎平魏秋月等是好友不努力怎么能见??箭大众SUV起家的旗舰车型, 途观L在众多人眼里依旧能打金辉控股(09993)上涨50.68%, 报3.3元/股独行侠被狼队压制! 欧文24+1东契奇6中1, 华子13+8, 李凯尔大爆发

最新回复(0)