pplx-embed – Perplexity推出的系列文本嵌入模型

AI工具3周前发布
21 0

pplx-embed是什么

pplx-embed 是 Perplexity 推出的系列文本嵌入模型,包含标准检索的 pplx-embed-v1 和上下文感知的 pplx-embed-context-v1,均提供 0.6B 和 4B 两种规模。模型通过扩散式持续预训练将因果解码器转换为双向编码器,实现全向注意力理解,原生支持 INT8 和 Binary 量化输出,存储压缩最高达 32 倍。模型无需指令前缀可在 MTEB、ConTEB 等基准测试中达到 SOTA 性能,其中 4B 上下文模型以 81.96% 的得分刷新 ConTEB 纪录。

pplx-embed – Perplexity推出的系列文本嵌入模型

pplx-embed的主要功能

  • 密集文本检索:将查询和文档映射到共享语义空间,通过近似最近邻搜索实现高效检索。

© 版权声明

相关文章