向量化模型

向量化模型,主要面向向量检索的使用场景,支持中、英双语。通过这篇教程,您可以了解如何完成向量化模型配置。

1.模型系列

智谱Embedding系列

Embedding系列上下文长度并发数Tokens计费
Embedding-28K100输入:¥0.5/M Tokens
输出:¥0.5/M Tokens
Embedding-38K300输入:¥0.5/M Tokens
输出:¥0.5/M Tokens

Doubao-Embedding系列

Doubao-Embedding系列上下文长度RPMTPMTokens计费
Doubao-Embedding-Text4K1k120w输入:¥0.89/M Tokens
输出:¥0.89/M Tokens
Doubao-Embedding-Large-Text128K1k80w输入:¥1.25/M Tokens
输出:¥1.25/M Tokens

2.使用前提

您已创建大模型平台API_Key,用于模型调用。

3.模型选择

智谱Embedding系列模型:

为文本向量模型,支持将输入的文本信息进行向量化表示,以便结合向量数据库为大模型提供外部知识库。

  • embedding-2 的单条请求最多支持 512 个Tokens,数组总长度不得超过8K;
  • embedding-3 的单条请求最多支持 3072 个Tokens,且数组最大不得超过 64 条。

Doubao-Embedding系列模型:

当前优先支持文本向量化模型,主要面向向量检索的使用场景,支持中、英双语,最长 128K 上下文长度。

图文向量化模型待更新。

4.API接入方式

向量模型支持两种接入方式:本地客户端接入、代码接入。

4.1 本地客户端接入

支持AnythingLLM、RAGFlow接入。

4.2 代码接入

支持 curl、python、golang、java、nodejs