> ## Documentation Index
> Fetch the complete documentation index at: https://speshu.ai/docs/llms.txt
> Use this file to discover all available pages before exploring further.

# Qdrant Vector Store: как сделать быстрый RAG-поиск и хранить embeddings

> Практический обзор Qdrant Vector Store: vector search, collections, payload, embeddings, RAG и пример со SpeShu.AI.

Qdrant Vector Store — open-source vector database и vector search engine. Его используют для RAG, semantic search, рекомендаций, поиска похожих объектов и хранения embeddings с metadata.

О Qdrant говорят потому, что он прост в запуске, даёт понятный API и хорошо подходит для production vector search. В RAG-системах он отвечает за быстрый поиск релевантных chunks перед вызовом LLM.

В статье разберём, как работает Qdrant и как создать embeddings через SpeShu.AI.

## Что такое qdrant vector store

Qdrant — это база данных для vectors. Вы создаёте collection, задаёте размерность и distance metric, загружаете points с vector и payload, а затем выполняете similarity search.

Инструмент нужен backend-разработчикам, AI-стартапам, поисковым командам и компаниям, которые строят RAG по документам, товарам, тикетам или знаниям.

Payload позволяет хранить рядом с vector полезные поля: текст chunk, document\_id, org\_id, timestamp, category, права доступа.

## Как работает qdrant vector store

Пайплайн:

* документ разбивается на chunks;
* embedding model создаёт vector;
* Qdrant сохраняет vector и payload;
* вопрос пользователя превращается в query vector;
* Qdrant возвращает top-k похожих points;
* LLM получает контекст и отвечает.

Qdrant поддерживает HNSW indexing, фильтры, payload, quantization и разные SDK. Для SpeShu.AI вы создаёте embeddings через `/embeddings`, а Qdrant хранит результат.

## Что умеет qdrant vector store

* хранить vectors и payload;
* выполнять semantic search;
* фильтровать по metadata;
* работать локально, self-hosted или в cloud;
* поддерживать разные клиенты;
* использовать quantization;
* строить RAG и recommendation systems.

Мини-кейсы: поиск по базе знаний, похожие товары, похожие тикеты, semantic search по статьям, RAG для поддержки.

## qdrant vector store на практике

Пример ниже создаёт in-memory Qdrant collection, получает embeddings через SpeShu.AI и выполняет поиск.

```python theme={null} theme={null}
import os
from openai import OpenAI
from qdrant_client import QdrantClient
from qdrant_client.models import Distance, PointStruct, VectorParams

openai = OpenAI(
    base_url="https://speshu.ai/api/v1",
    api_key=os.environ["SPESHU_AI_API_KEY"],
)

texts = [
    "Qdrant хранит embeddings и payload для vector search.",
    "RAG использует поиск по документам перед ответом LLM.",
]

vectors = openai.embeddings.create(
    model="text-embedding-3-large",
    input=texts,
).data

client = QdrantClient(":memory:")
client.create_collection(
    collection_name="docs",
    vectors_config=VectorParams(size=3072, distance=Distance.COSINE),
)

client.upsert(
    collection_name="docs",
    points=[
        PointStruct(
            id=i,
            vector=item.embedding,
            payload={"text": text},
        )
        for i, (item, text) in enumerate(zip(vectors, texts))
    ],
)

query_vector = openai.embeddings.create(
    model="text-embedding-3-large",
    input="Как хранить embeddings для RAG?",
).data[0].embedding

hits = client.search(
    collection_name="docs",
    query_vector=query_vector,
    limit=2,
)

for hit in hits:
    print(hit.payload["text"], hit.score)
```

В production используйте постоянный Qdrant server, payload-фильтры по пользователю/организации и idempotent обновление points.

## Преимущества и недостатки qdrant vector store

Плюсы:

* быстрый и понятный vector search;
* хороший Python SDK;
* payload-фильтры;
* self-hosted и cloud варианты;
* подходит для production RAG.

Минусы:

* нужно сопровождать отдельное хранилище;
* качество поиска зависит от embeddings и chunking;
* schema и payload нужно проектировать заранее.

## qdrant vector store vs альтернативы

Qdrant vs Chroma: Chroma проще для локального MVP. Qdrant лучше для production, фильтров и нагрузки.

Qdrant vs Weaviate: Weaviate богаче встроенными модулями. Qdrant часто выбирают за простоту, скорость и API.

Qdrant vs Pinecone: Pinecone managed-first. Qdrant можно удобно self-hosted.

## Кому подойдёт qdrant vector store

Qdrant подойдёт backend-командам, AI-продуктам, корпоративным knowledge base, e-commerce, поддержке и поисковым сервисам.

Если RAG должен обслуживать пользователей и обновляемые данные, Qdrant — один из самых практичных вариантов.

## Как попробовать qdrant vector store через SpeShu.AI

SpeShu.AI закрывает создание embeddings и генерацию ответа:

* не нужен VPN;
* не нужна зарубежная карта;
* один ключ для chat и embeddings;
* доступ к нескольким моделям;
* быстрый старт через [speshu.ai/profile](https://speshu.ai/profile).

Создавайте embeddings через [endpoint](/api-reference/embeddings/create), храните их в Qdrant и передавайте найденный контекст в [Chat Completions](/api-reference/chat/completions).

## Заключение

Qdrant Vector Store — сильный выбор для RAG-поиска, где важны скорость, payload и self-hosted контроль. Главный инсайт: vector DB не исправит плохие chunks, но даст прочную основу для retrieval.

***

<Card title="Подключить API" icon="plug" type="tip" href="https://speshu.ai/profile">
  Запустите интеграцию через SpeShu.AI: единый доступ к AI-моделям, без VPN и зарубежной карты
</Card>
