deephub

获赞0
文章
7
评论
30
  • 在现代信息检索领域,单一检索模型的局限性日益显现。本文深入探讨如何通过多模型集成技术提升检索系统的性能,并详细介绍RAPTOR(RecursiveAbstractiveProcessingforTree-OrganizedRetrieval
    deephub28天前
    770
  • 联邦学习是一种分布式的机器学习方法,其中多个客户端在一个中央服务器的协调下合作训练模型,但不共享他们的本地数据。一般情况下我们对联邦学习的理解都是大模型和深度学习模型才可以进行联邦学习,其实基本上只要包含参数的机器学习方法都可以使用联邦学习
    deephub5月前
    610
  • 嵌入模型是大型语言模型检索增强生成(RAG)的关键组成部分。它们对知识库和用户编写的查询进行编码。使用与LLM相同领域的训练或微调的嵌入模型可以显著改进RAG系统。然而,寻找或训练这样的嵌入模型往往是一项困难的任务,因为领域内的数据通常是稀
    deephub6月前
    1480
  • 我们以前的文章中介绍过将知识图谱与RAG结合的示例,在本篇文章中我们将文本和知识图谱结合,来提升我们RAG的性能文本嵌入的RAG文本嵌入是单词或短语的数字表示,可以有效地捕捉它们的含义和上下文。可以将它们视为单词的唯一标识符——捕获它们所代
    deephub6月前
    1390
  • 图像处理是一种数学计算。数字图像由称为像素的彩色小点组成。每个像素由红、绿、蓝(RGB)三个独立的颜色组成。每个像素中的主色由每个RGB分量的数值决定。本文将介绍10个使用使用NumPy就可以进行的图像处理步骤,虽然有更强大的图像处理库,但
    deephub6月前
    570
  • 在本篇文章,我们将详细讨论推测解码,这是一种可以将LLM推理速度提高约2-3倍而不降低任何准确性的方法。我们还将会介绍推测解码代码实现,并看看它与原始transformer实现相比到底能快多少。推测解码是一种“先推测后验证”(Draft-t
    deephub7月前
    1200
  • 在当今以数据驱动为主导的世界里,清晰且具有洞察力的数据可视化至关重要。然而,在创建数据可视化时很容易犯错误,这可能导致对数据的错误解读。本文将探讨一些常见的糟糕数据可视化示例,并提供如何避免这些错误的建议。本文总结了10个数据可视化的十个典
    deephub8月前
    1440