fix: Remove LiteLLM model support check (#2046)

* Remove model_list check, it's not current * Try to fix line endings (again) * Ruff 🐶
Arize-ai · Jan 8, 2024 · 45d3fe6 · 45d3fe6
1 parent 9ce4ec7
commit 45d3fe6
Showing 1 changed file with 120 additions and 125 deletions.
diff --git a/src/phoenix/experimental/evals/models/litellm.py b/src/phoenix/experimental/evals/models/litellm.py
@@ -1,125 +1,120 @@
-import logging
-from dataclasses import dataclass, field
-from typing import TYPE_CHECKING, Any, Dict, List, Optional
-
-from phoenix.experimental.evals.models.base import BaseEvalModel
-
-if TYPE_CHECKING:
-    from tiktoken import Encoding
-
-logger = logging.getLogger(__name__)
-
-
-@dataclass
-class LiteLLMModel(BaseEvalModel):
-    model_name: str = "gpt-3.5-turbo"
-    """The model name to use."""
-    temperature: float = 0.0
-    """What sampling temperature to use."""
-    max_tokens: int = 256
-    """The maximum number of tokens to generate in the completion."""
-    top_p: float = 1
-    """Total probability mass of tokens to consider at each step."""
-    num_retries: int = 6
-    """Maximum number to retry a model if an RateLimitError, OpenAIError, or
-    ServiceUnavailableError occurs."""
-    request_timeout: int = 60
-    """Maximum number of seconds to wait when retrying."""
-    model_kwargs: Dict[str, Any] = field(default_factory=dict)
-    """Model specific params"""
-
-    # non-LiteLLM params
-    retry_min_seconds: int = 10
-    """Minimum number of seconds to wait when retrying."""
-    max_content_size: Optional[int] = None
-    """If you're using a fine-tuned model, set this to the maximum content size"""
-
-    def __post_init__(self) -> None:
-        self._init_environment()
-        self._init_model_encoding()
-
-    def _init_environment(self) -> None:
-        try:
-            import litellm
-            from litellm import validate_environment
-
-            self._litellm = litellm
-            env_info = validate_environment(self._litellm.utils.get_llm_provider(self.model_name))
-
-            if not env_info["keys_in_environment"]:
-                raise RuntimeError(
-                    f"Missing environment variable(s): '{str(env_info['missing_keys'])}', for "
-                    f"model: {self.model_name}. \nFor additional information about the right "
-                    "environment variables for specific model providers:\n"
-                    "https://docs.litellm.ai/docs/completion/input#provider-specific-params."
-                )
-        except ImportError:
-            self._raise_import_error(
-                package_display_name="LiteLLM",
-                package_name="litellm",
-            )
-
-    def _init_model_encoding(self) -> None:
-        from litellm import decode, encode
-
-        if self.model_name in self._litellm.model_list:
-            self._encoding = encode
-            self._decoding = decode
-        else:
-            raise ValueError(
-                f"Model name not found in the LiteLLM's models list: \n{self._litellm.model_list}"
-            )
-
-    @property
-    def max_context_size(self) -> int:
-        context_size = self.max_content_size or self._litellm.get_max_tokens(self.model_name).get(
-            "max_tokens", None
-        )
-
-        if context_size is None:
-            raise ValueError(
-                "Can't determine maximum context size. An unknown model name was "
-                + f"used: {self.model_name}."
-            )
-
-        return context_size
-
-    @property
-    def encoder(self) -> "Encoding":
-        raise NotImplementedError
-
-    def get_tokens_from_text(self, text: str) -> List[int]:
-        result: List[int] = self._encoding(model=self.model_name, text=text)
-        return result
-
-    def get_text_from_tokens(self, tokens: List[int]) -> str:
-        return str(self._decoding(model=self.model_name, tokens=tokens))
-
-    async def _async_generate(self, prompt: str, **kwargs: Dict[str, Any]) -> str:
-        return self._generate(prompt, **kwargs)
-
-    def _generate(self, prompt: str, **kwargs: Dict[str, Any]) -> str:
-        messages = self._get_messages_from_prompt(prompt)
-        return str(
-            self._generate_with_retry(
-                model=self.model_name,
-                messages=messages,
-                temperature=self.temperature,
-                max_tokens=self.max_tokens,
-                top_p=self.top_p,
-                num_retries=self.num_retries,
-                request_timeout=self.request_timeout,
-                **self.model_kwargs,
-            )
-        )
-
-    def _generate_with_retry(self, **kwargs: Any) -> Any:
-        # Using default LiteLLM completion with retries = self.num_retries.
-
-        response = self._litellm.completion(**kwargs)
-        return response.choices[0].message.content
-
-    def _get_messages_from_prompt(self, prompt: str) -> List[Dict[str, str]]:
-        # LiteLLM requires prompts in the format of messages
-        # messages=[{"content": "ABC?","role": "user"}]
-        return [{"content": prompt, "role": "user"}]
+import logging
+from dataclasses import dataclass, field
+from typing import TYPE_CHECKING, Any, Dict, List, Optional
+
+from phoenix.experimental.evals.models.base import BaseEvalModel
+
+if TYPE_CHECKING:
+    from tiktoken import Encoding
+
+logger = logging.getLogger(__name__)
+
+
+@dataclass
+class LiteLLMModel(BaseEvalModel):
+    model_name: str = "gpt-3.5-turbo"
+    """The model name to use."""
+    temperature: float = 0.0
+    """What sampling temperature to use."""
+    max_tokens: int = 256
+    """The maximum number of tokens to generate in the completion."""
+    top_p: float = 1
+    """Total probability mass of tokens to consider at each step."""
+    num_retries: int = 6
+    """Maximum number to retry a model if an RateLimitError, OpenAIError, or
+    ServiceUnavailableError occurs."""
+    request_timeout: int = 60
+    """Maximum number of seconds to wait when retrying."""
+    model_kwargs: Dict[str, Any] = field(default_factory=dict)
+    """Model specific params"""
+
+    # non-LiteLLM params
+    retry_min_seconds: int = 10
+    """Minimum number of seconds to wait when retrying."""
+    max_content_size: Optional[int] = None
+    """If you're using a fine-tuned model, set this to the maximum content size"""
+
+    def __post_init__(self) -> None:
+        self._init_environment()
+        self._init_model_encoding()
+
+    def _init_environment(self) -> None:
+        try:
+            import litellm
+            from litellm import validate_environment
+
+            self._litellm = litellm
+            env_info = validate_environment(self._litellm.utils.get_llm_provider(self.model_name))
+
+            if not env_info["keys_in_environment"]:
+                raise RuntimeError(
+                    f"Missing environment variable(s): '{str(env_info['missing_keys'])}', for "
+                    f"model: {self.model_name}. \nFor additional information about the right "
+                    "environment variables for specific model providers:\n"
+                    "https://docs.litellm.ai/docs/completion/input#provider-specific-params."
+                )
+        except ImportError:
+            self._raise_import_error(
+                package_display_name="LiteLLM",
+                package_name="litellm",
+            )
+
+    def _init_model_encoding(self) -> None:
+        from litellm import decode, encode
+
+        self._encoding = encode
+        self._decoding = decode
+
+    @property
+    def max_context_size(self) -> int:
+        context_size = self.max_content_size or self._litellm.get_max_tokens(self.model_name).get(
+            "max_tokens", None
+        )
+
+        if context_size is None:
+            raise ValueError(
+                "Can't determine maximum context size. An unknown model name was "
+                + f"used: {self.model_name}."
+            )
+
+        return context_size
+
+    @property
+    def encoder(self) -> "Encoding":
+        raise NotImplementedError
+
+    def get_tokens_from_text(self, text: str) -> List[int]:
+        result: List[int] = self._encoding(model=self.model_name, text=text)
+        return result
+
+    def get_text_from_tokens(self, tokens: List[int]) -> str:
+        return str(self._decoding(model=self.model_name, tokens=tokens))
+
+    async def _async_generate(self, prompt: str, **kwargs: Dict[str, Any]) -> str:
+        return self._generate(prompt, **kwargs)
+
+    def _generate(self, prompt: str, **kwargs: Dict[str, Any]) -> str:
+        messages = self._get_messages_from_prompt(prompt)
+        return str(
+            self._generate_with_retry(
+                model=self.model_name,
+                messages=messages,
+                temperature=self.temperature,
+                max_tokens=self.max_tokens,
+                top_p=self.top_p,
+                num_retries=self.num_retries,
+                request_timeout=self.request_timeout,
+                **self.model_kwargs,
+            )
+        )
+
+    def _generate_with_retry(self, **kwargs: Any) -> Any:
+        # Using default LiteLLM completion with retries = self.num_retries.
+
+        response = self._litellm.completion(**kwargs)
+        return response.choices[0].message.content
+
+    def _get_messages_from_prompt(self, prompt: str) -> List[Dict[str, str]]:
+        # LiteLLM requires prompts in the format of messages
+        # messages=[{"content": "ABC?","role": "user"}]
+        return [{"content": prompt, "role": "user"}]