Allow ndarray as query vector input

Fixes #17
langchain-ai · Apr 24, 2024 · 60c09da · 60c09da
1 parent f573a52
commit 60c09da
Show file tree

Hide file tree

Showing 2 changed files with 37 additions and 2 deletions.
diff --git a/libs/elasticsearch/langchain_elasticsearch/vectorstores.py b/libs/elasticsearch/langchain_elasticsearch/vectorstores.py
@@ -151,8 +151,8 @@ def query(
         }
 
         # Embedding provided via the embedding function
-        if query_vector and not self.query_model_id:
-            knn["query_vector"] = query_vector
+        if query_vector is not None and not self.query_model_id:
+            knn["query_vector"] = list(query_vector)
 
         # Case 2: Used when model has been deployed to
         # Elasticsearch and can infer the query vector from the query text

diff --git a/libs/elasticsearch/tests/integration_tests/test_vectorstores.py b/libs/elasticsearch/tests/integration_tests/test_vectorstores.py
@@ -5,6 +5,7 @@
 import uuid
 from typing import Any, Dict, Generator, List, Union
 
+import numpy as np
 import pytest
 from elasticsearch import NotFoundError
 from elasticsearch.helpers import BulkIndexError
@@ -465,6 +466,40 @@ def assert_query(query_body: dict, query: str) -> dict:
         output = docsearch.similarity_search("foo", k=1, custom_query=assert_query)
         assert output == [Document(page_content="foo")]
 
+    def test_similarity_search_approx_by_vector(
+        self, elasticsearch_connection: dict, index_name: str
+    ) -> None:
+        """Test end to end construction and search with metadata."""
+        texts = ["foo", "bar", "baz"]
+        embeddings = ConsistentFakeEmbeddings()
+        docsearch = ElasticsearchStore.from_texts(
+            texts,
+            embedding=embeddings,
+            **elasticsearch_connection,
+            index_name=index_name,
+        )
+        query_vector = embeddings.embed_query("foo")
+
+        def assert_query(query_body: dict, query: str) -> dict:
+            assert query_body == {
+                "knn": {
+                    "field": "vector",
+                    "filter": [],
+                    "k": 1,
+                    "num_candidates": 50,
+                    "query_vector": query_vector,
+                },
+            }
+            return query_body
+
+        # accept ndarray as query vector
+        output = docsearch.similarity_search_by_vector_with_relevance_scores(
+            np.array(query_vector),  # type: ignore
+            k=1,
+            custom_query=assert_query,
+        )
+        assert output == [(Document(page_content="foo"), 1.0)]
+
     def test_similarity_search_approx_with_hybrid_search_rrf(
         self, es_client: Any, elasticsearch_connection: dict, index_name: str
     ) -> None: