向量化模型

向量化模型，主要面向向量检索的使用场景，支持中、英双语。通过这篇教程，您可以了解如何完成向量化模型配置。

1.模型系列

智谱Embedding系列

Embedding系列	上下文长度	并发数	Tokens计费
Embedding-2	8K	100	输入：￥0.5/M Tokens 输出：￥0.5/M Tokens
Embedding-3	8K	300	输入：￥0.5/M Tokens 输出：￥0.5/M Tokens

Doubao-Embedding系列

Doubao-Embedding系列	上下文长度	RPM	TPM	Tokens计费
Doubao-Embedding-Text	4K	1k	120w	输入：￥0.89/M Tokens 输出：￥0.89/M Tokens
Doubao-Embedding-Large-Text	128K	1k	80w	输入：￥1.25/M Tokens 输出：￥1.25/M Tokens

2.使用前提

您已创建大模型平台API_Key，用于模型调用。

若您还未申请，请前往 AI 智算云平台-大模型平台-模型广场

3.模型选择

智谱Embedding系列模型：

为文本向量模型，支持将输入的文本信息进行向量化表示，以便结合向量数据库为大模型提供外部知识库。

embedding-2 的单条请求最多支持 512 个Tokens，数组总长度不得超过8K；
embedding-3 的单条请求最多支持 3072 个Tokens，且数组最大不得超过 64 条。

Doubao-Embedding系列模型：

当前优先支持文本向量化模型，主要面向向量检索的使用场景，支持中、英双语，最长 128K 上下文长度。

图文向量化模型待更新。

4.API接入方式

向量模型支持两种接入方式：本地客户端接入、代码接入。

4.1 本地客户端接入

支持AnythingLLM、RAGFlow接入。

4.2 代码接入

支持 curl、python、golang、java、nodejs

package main
 
import (
    "bytes"
    "encoding/json"
    "fmt"
    "io"
    "log"
    "net/http"
    "os"
)
 
// 定义请求结构体
type EmbeddingRequest struct {
    Model string   `json:"model"`
    Input []string `json:"input"`
}
 
// 定义响应结构体
type EmbeddingResponse struct {
    Data []struct {
        Embedding []float64 `json:"embedding"`
        Index     int       `json:"index"`
    } `json:"data"`
    Model  string `json:"model"`
    Object string `json:"object"`
}
 
func main() {
    // 配置参数（建议从环境变量获取）
    apiKey := "申请到的key"
    modelID := "模型ID"
    texts := []string{"需要转embedding的内容"}
 
    // 1. 创建请求体
    reqBody := EmbeddingRequest{
        Model: modelID,
        Input: texts,
    }
 
    // 2. 序列化JSON
    jsonData, err := json.Marshal(reqBody)
    if err != nil {
        log.Fatalf("JSON序列化失败: %v", err)
    }
 
    // 3. 创建HTTP请求
    req, err := http.NewRequest(
        "POST",
        "https://$BASE_URL/v1/embeddings",
        bytes.NewBuffer(jsonData),
    )
    if err != nil {
        log.Fatalf("创建请求失败: %v", err)
    }
 
    // 4. 设置请求头
    req.Header.Set("Authorization", "Bearer "+apiKey)
    req.Header.Set("Content-Type", "application/json")
 
    // 5. 配置HTTP客户端
    client := &http.Client{
        Timeout: 30 * time.Second, // 设置超时
    }
 
    // 6. 发送请求
    resp, err := client.Do(req)
    if err != nil {
        log.Fatalf("请求发送失败: %v", err)
    }
    defer resp.Body.Close()
 
    // 7. 处理响应状态
    if resp.StatusCode != http.StatusOK {
        body, _ := io.ReadAll(resp.Body)
        log.Fatalf("请求失败 [%d]: %s", resp.StatusCode, string(body))
    }
 
    // 8. 解析响应数据
    var result EmbeddingResponse
    if err := json.NewDecoder(resp.Body).Decode(&result); err != nil {
        log.Fatalf("响应解析失败: %v", err)
    }
 
    // 9. 输出结果
    fmt.Println("Embedding生成成功:")
    for _, item := range result.Data {
        fmt.Printf("文本 %d:\n", item.Index+1)
        fmt.Printf("  向量维度: %d\n", len(item.Embedding))
        fmt.Printf("  前5个值: %.4f, %.4f, %.4f, %.4f, %.4f\n",
            item.Embedding[0],
            item.Embedding[1],
            item.Embedding[2],
            item.Embedding[3],
            item.Embedding[4],
        )
    }
}

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.io.OutputStream;
import java.net.HttpURLConnection;
import java.net.URL;
 
public class EmbeddingGenerator {
    public static void main(String[] args) {
        try {
            // 1. 创建URL对象
            URL url = new URL("https://$BASE_URL/v1/embeddings");
            HttpURLConnection connection = (HttpURLConnection) url.openConnection();
            
            // 2. 配置请求头
            connection.setRequestMethod("POST");
            connection.setRequestProperty("Authorization", "Bearer 申请到的key");
            connection.setRequestProperty("Content-Type", "application/json");
            connection.setDoOutput(true);
 
            // 3. 构建JSON请求体
            String jsonInputString = "{"
                + "\"model\": \"模型ID\","
                + "\"input\": [\"需要转embedding的内容\"]"
                + "}";
 
            // 4. 发送请求
            try(OutputStream os = connection.getOutputStream()) {
                byte[] input = jsonInputString.getBytes("utf-8");
                os.write(input, 0, input.length);
            }
 
            // 5. 处理响应
            int statusCode = connection.getResponseCode();
            if (statusCode == HttpURLConnection.HTTP_OK) {
                try(BufferedReader br = new BufferedReader(
                    new InputStreamReader(connection.getInputStream(), "utf-8"))) {
                    
                    StringBuilder response = new StringBuilder();
                    String responseLine;
                    while ((responseLine = br.readLine()) != null) {
                        response.append(responseLine.trim());
                    }
                    System.out.println("Embedding结果:\n" + response.toString());
                }
            } else {
                System.out.println("请求失败，状态码: " + statusCode);
            }
 
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

图像生成视频生成