update async pipeline example (#10042)

dfokina · web-flow · commit edd5a99e83de · 2025-11-10T11:56:45.000+01:00
diff --git a/docs-website/docs/concepts/pipelines/asyncpipeline.mdx b/docs-website/docs/concepts/pipelines/asyncpipeline.mdx
@@ -52,37 +52,85 @@ You can find more details in our [API Reference](/reference/pipeline-api#asyncpi
 
 ```python
 import asyncio
-from haystack import AsyncPipeline
-from haystack.components.embedders import SentenceTransformersTextEmbedder
-from haystack.components.retrievers import InMemoryEmbeddingRetriever, InMemoryBM25Retriever
-from haystack.components.joiners import DocumentJoiner
+
+from haystack import AsyncPipeline, Document
 from haystack.components.builders import ChatPromptBuilder
+from haystack.components.embedders import (
+    SentenceTransformersDocumentEmbedder,
+    SentenceTransformersTextEmbedder,
+)
 from haystack.components.generators.chat import OpenAIChatGenerator
+from haystack.components.joiners import DocumentJoiner
+from haystack.components.retrievers import InMemoryBM25Retriever, InMemoryEmbeddingRetriever
+from haystack.dataclasses import ChatMessage
+from haystack.document_stores.in_memory import InMemoryDocumentStore
+
+documents = [
+    Document(content="Khufu is the largest pyramid."),
+    Document(content="Khafre is the middle pyramid."),
+    Document(content="Menkaure is the smallest pyramid."),
+]
+
+docs_embedder = SentenceTransformersDocumentEmbedder()
+docs_embedder.warm_up()
+
+document_store = InMemoryDocumentStore()
+document_store.write_documents(docs_embedder.run(documents=documents)["documents"])
+
+prompt_template = [
+    ChatMessage.from_system(
+        """
+        You are a precise, factual QA assistant.
+        According to the following documents:
+        {% for document in documents %}
+        {{document.content}}
+        {% endfor %}
+
+        If an answer cannot be deduced from the documents, say "I don't know based on these documents".
+
+        When answering:
+        - be concise
+        - list the documents that support your answer
+
+        Answer the given question.
+        """
+    ),
+    ChatMessage.from_user("{{query}}"),
+    ChatMessage.from_system("Answer:"),
+]
 
 hybrid_rag_retrieval = AsyncPipeline()
 hybrid_rag_retrieval.add_component("text_embedder", SentenceTransformersTextEmbedder())
-hybrid_rag_retrieval.add_component("embedding_retriever", InMemoryEmbeddingRetriever(document_store=document_store))
-hybrid_rag_retrieval.add_component("bm25_retriever", InMemoryBM25Retriever(document_store=document_store))
+hybrid_rag_retrieval.add_component(
+    "embedding_retriever", InMemoryEmbeddingRetriever(document_store=document_store, top_k=3)
+)
+hybrid_rag_retrieval.add_component("bm25_retriever", InMemoryBM25Retriever(document_store=document_store, top_k=3))
 hybrid_rag_retrieval.add_component("document_joiner", DocumentJoiner())
 hybrid_rag_retrieval.add_component("prompt_builder", ChatPromptBuilder(template=prompt_template))
 hybrid_rag_retrieval.add_component("llm", OpenAIChatGenerator())
 
-hybrid_rag_retrieval.connect("text_embedder", "embedding_retriever")
-hybrid_rag_retrieval.connect("bm25_retriever", "document_joiner")
-hybrid_rag_retrieval.connect("embedding_retriever", "document_joiner")
-hybrid_rag_retrieval.connect("document_joiner", "prompt_builder.documents")
-hybrid_rag_retrieval.connect("prompt_builder", "llm")
+hybrid_rag_retrieval.connect("text_embedder.embedding", "embedding_retriever.query_embedding")
+hybrid_rag_retrieval.connect("bm25_retriever.documents", "document_joiner.documents")
+hybrid_rag_retrieval.connect("embedding_retriever.documents", "document_joiner.documents")
+hybrid_rag_retrieval.connect("document_joiner.documents", "prompt_builder.documents")
+hybrid_rag_retrieval.connect("prompt_builder.prompt", "llm.messages")
+
+question = "Which pyramid is neither the smallest nor the biggest?"
+
+data = {
+    "prompt_builder": {"query": question},
+    "text_embedder": {"text": question},
+    "bm25_retriever": {"query": question},
+}
 
 async def process_results():
     async for partial_output in hybrid_rag_retrieval.run_async_generator(
-            data=data,
-            include_outputs_from={"document_joiner", "llm"}
+        data=data, include_outputs_from={"document_joiner", "llm"}
     ):
-        # Each partial_output contains the results from a completed component
-        if "retriever" in partial_output:
+        if "document_joiner" in partial_output:
             print("Retrieved documents:", len(partial_output["document_joiner"]["documents"]))
         if "llm" in partial_output:
             print("Generated answer:", partial_output["llm"]["replies"][0])
 
 asyncio.run(process_results())
-```
+```