PR feedback fixes

colin-sentry · colin-sentry · commit 8245e12693e4 · 2024-03-07T11:02:15.000-05:00
diff --git a/sentry_sdk/consts.py b/sentry_sdk/consts.py
@@ -219,6 +219,8 @@ class OP:
     MIDDLEWARE_STARLITE = "middleware.starlite"
     MIDDLEWARE_STARLITE_RECEIVE = "middleware.starlite.receive"
     MIDDLEWARE_STARLITE_SEND = "middleware.starlite.send"
+    OPENAI_CHAT_COMPLETIONS_CREATE = "openai.chat_completions.create"
+    OPENAI_EMBEDDINGS_CREATE = "openai.embeddings.create"
     QUEUE_SUBMIT_ARQ = "queue.submit.arq"
     QUEUE_TASK_ARQ = "queue.task.arq"
     QUEUE_SUBMIT_CELERY = "queue.submit.celery"
diff --git a/sentry_sdk/integrations/openai.py b/sentry_sdk/integrations/openai.py
@@ -1,15 +1,15 @@
-from __future__ import absolute_import
-
+from sentry_sdk import consts
 from sentry_sdk._types import TYPE_CHECKING
 
 if TYPE_CHECKING:
     from typing import Any, Iterable, List, Optional, Callable, Iterator
     from sentry_sdk.tracing import Span
 
+import sentry_sdk
 from sentry_sdk._functools import wraps
 from sentry_sdk.hub import Hub
 from sentry_sdk.integrations import DidNotEnable, Integration
-from sentry_sdk.utils import logger, capture_internal_exceptions
+from sentry_sdk.utils import logger, capture_internal_exceptions, event_from_exception
 
 try:
     from openai.resources.chat.completions import Completions
@@ -42,9 +42,9 @@ def count_tokens(s):
         return 0
 
 
-COMPLETION_TOKENS = "completion_tоkens"
-PROMPT_TOKENS = "prompt_tоkens"
-TOTAL_TOKENS = "total_tоkens"
+COMPLETION_TOKENS_USED = "ai.completion_tоkens.used"
+PROMPT_TOKENS_USED = "ai.prompt_tоkens.used"
+TOTAL_TOKENS_USED = "ai.total_tоkens.used"
 
 
 class OpenAIIntegration(Integration):
@@ -54,7 +54,19 @@ class OpenAIIntegration(Integration):
     def setup_once():
         # type: () -> None
         Completions.create = _wrap_chat_completion_create(Completions.create)
-        Embeddings.create = _wrap_enbeddings_create(Embeddings.create)
+        Embeddings.create = _wrap_embeddings_create(Embeddings.create)
+
+
+def _capture_exception(hub, exc):
+    # type: (Hub, Any) -> None
+
+    if hub.client is not None:
+        event, hint = event_from_exception(
+            exc,
+            client_options=hub.client.options,
+            mechanism={"type": "openai", "handled": False},
+        )
+        hub.capture_event(event, hint=hint)
 
 
 def _calculate_chat_completion_usage(
@@ -98,23 +110,18 @@ def _calculate_chat_completion_usage(
         total_tokens = prompt_tokens + completion_tokens
 
     if completion_tokens != 0:
-        span.set_data(COMPLETION_TOKENS, completion_tokens)
+        span.set_data(COMPLETION_TOKENS_USED, completion_tokens)
     if prompt_tokens != 0:
-        span.set_data(PROMPT_TOKENS, prompt_tokens)
+        span.set_data(PROMPT_TOKENS_USED, prompt_tokens)
     if total_tokens != 0:
-        span.set_data(TOTAL_TOKENS, total_tokens)
+        span.set_data(TOTAL_TOKENS_USED, total_tokens)
 
 
 def _wrap_chat_completion_create(f):
     # type: (Callable[..., Any]) -> Callable[..., Any]
     @wraps(f)
     def new_chat_completion(*args, **kwargs):
         # type: (*Any, **Any) -> Any
-        hub = Hub.current
-        integration = hub.get_integration(OpenAIIntegration)
-        if integration is None:
-            return f(*args, **kwargs)
-
         if "messages" not in kwargs:
             # invalid call (in all versions of openai), let it return error
             return f(*args, **kwargs)
@@ -130,13 +137,21 @@ def new_chat_completion(*args, **kwargs):
         model = kwargs.get("model")
         streaming = kwargs.get("stream")
 
-        span = hub.start_span(op="openai", description="Chat Completion")
+        span = sentry_sdk.start_span(
+            op=consts.OP.OPENAI_CHAT_COMPLETIONS_CREATE, description="Chat Completion"
+        )
         span.__enter__()
-        res = f(*args, **kwargs)
+        try:
+            res = f(*args, **kwargs)
+        except Exception as e:
+            _capture_exception(Hub.current, e)
+            span.__exit__(None, None, None)
+            raise e from None
+
         with capture_internal_exceptions():
             span.set_data("messages", messages)
-            span.set_tag("model", model)
-            span.set_tag("streaming", streaming)
+            span.set_data("model", model)
+            span.set_data("streaming", streaming)
 
             if hasattr(res, "choices"):
                 span.set_data("response", res.choices[0].message)
@@ -175,32 +190,34 @@ def new_iterator():
 
                 res._iterator = new_iterator()
             else:
-                span.set_tag("unknown_response", True)
+                span.set_data("unknown_response", True)
                 span.__exit__(None, None, None)
             return res
 
     return new_chat_completion
 
 
-def _wrap_enbeddings_create(f):
+def _wrap_embeddings_create(f):
     # type: (Callable[..., Any]) -> Callable[..., Any]
 
     @wraps(f)
     def new_embeddings_create(*args, **kwargs):
         # type: (*Any, **Any) -> Any
-        hub = Hub.current
-        integration = hub.get_integration(OpenAIIntegration)
-        if integration is None:
-            return f(*args, **kwargs)
-
-        with hub.start_span(op="openai", description="Embeddings Creation") as span:
+        with sentry_sdk.start_span(
+            op=consts.OP.OPENAI_EMBEDDINGS_CREATE,
+            description="OpenAI Embedding Creation",
+        ) as span:
             if "input" in kwargs and isinstance(kwargs["input"], str):
                 span.set_data("input", kwargs["input"])
             if "model" in kwargs:
-                span.set_tag("model", kwargs["model"])
+                span.set_data("model", kwargs["model"])
             if "dimensions" in kwargs:
-                span.set_tag("dimensions", kwargs["dimensions"])
-            response = f(*args, **kwargs)
+                span.set_data("dimensions", kwargs["dimensions"])
+            try:
+                response = f(*args, **kwargs)
+            except Exception as e:
+                _capture_exception(Hub.current, e)
+                raise e from None
 
             prompt_tokens = 0
             total_tokens = 0
@@ -220,8 +237,8 @@ def new_embeddings_create(*args, **kwargs):
             if total_tokens == 0:
                 total_tokens = prompt_tokens
 
-            span.set_data(PROMPT_TOKENS, prompt_tokens)
-            span.set_data(TOTAL_TOKENS, total_tokens)
+            span.set_data(PROMPT_TOKENS_USED, prompt_tokens)
+            span.set_data(TOTAL_TOKENS_USED, total_tokens)
 
             return response
 
diff --git a/tests/integrations/openai/test_openai.py b/tests/integrations/openai/test_openai.py
@@ -1,21 +1,20 @@
-from openai import OpenAI, Stream
+import pytest
+from openai import OpenAI, Stream, OpenAIError
 from openai.types import CompletionUsage, CreateEmbeddingResponse, Embedding
 from openai.types.chat import ChatCompletion, ChatCompletionMessage, ChatCompletionChunk
 from openai.types.chat.chat_completion import Choice
 from openai.types.chat.chat_completion_chunk import ChoiceDelta, Choice as DeltaChoice
 from openai.types.create_embedding_response import Usage as EmbeddingTokenUsage
 
 from sentry_sdk import start_transaction
-from sentry_sdk.integrations.openai import OpenAIIntegration
+from sentry_sdk.integrations.openai import (
+    OpenAIIntegration,
+    COMPLETION_TOKENS_USED,
+    PROMPT_TOKENS_USED,
+    TOTAL_TOKENS_USED,
+)
 
-try:
-    from unittest import mock  # python 3.3 and above
-except ImportError:
-    import mock  # python < 3.3
-
-COMPLETION_TOKENS = "completion_tоkens"
-PROMPT_TOKENS = "prompt_tоkens"
-TOTAL_TOKENS = "total_tоkens"
+from unittest import mock  # python 3.3 and above
 
 
 def test_nonstreaming_chat_completion(sentry_init, capture_events):
@@ -56,11 +55,11 @@ def test_nonstreaming_chat_completion(sentry_init, capture_events):
     tx = events[0]
     assert tx["type"] == "transaction"
     span = tx["spans"][0]
-    assert span["op"] == "openai"
+    assert span["op"] == "openai.chat_completions.create"
 
-    assert span["data"][COMPLETION_TOKENS] == 10
-    assert span["data"][PROMPT_TOKENS] == 20
-    assert span["data"][TOTAL_TOKENS] == 30
+    assert span["data"][COMPLETION_TOKENS_USED] == 10
+    assert span["data"][PROMPT_TOKENS_USED] == 20
+    assert span["data"][TOTAL_TOKENS_USED] == 30
 
 
 # noinspection PyTypeChecker
@@ -118,10 +117,27 @@ def test_streaming_chat_completion(sentry_init, capture_events):
     tx = events[0]
     assert tx["type"] == "transaction"
     span = tx["spans"][0]
-    assert span["op"] == "openai"
-    assert span["data"][COMPLETION_TOKENS] == 2
-    assert span["data"][PROMPT_TOKENS] == 1
-    assert span["data"][TOTAL_TOKENS] == 3
+    assert span["op"] == "openai.chat_completions.create"
+    assert span["data"][COMPLETION_TOKENS_USED] == 2
+    assert span["data"][PROMPT_TOKENS_USED] == 1
+    assert span["data"][TOTAL_TOKENS_USED] == 3
+
+
+def test_bad_chat_completion(sentry_init, capture_events):
+    sentry_init(integrations=[OpenAIIntegration()], traces_sample_rate=1.0)
+    events = capture_events()
+
+    client = OpenAI(api_key="z")
+    client.chat.completions._post = mock.Mock(
+        side_effect=OpenAIError("API rate limit reached")
+    )
+    with pytest.raises(OpenAIError):
+        client.chat.completions.create(
+            model="some-model", messages=[{"role": "system", "content": "hello"}]
+        )
+
+    (event,) = events
+    assert event["level"] == "error"
 
 
 def test_embeddings_create(sentry_init, capture_events):
@@ -151,7 +167,7 @@ def test_embeddings_create(sentry_init, capture_events):
     tx = events[0]
     assert tx["type"] == "transaction"
     span = tx["spans"][0]
-    assert span["op"] == "openai"
+    assert span["op"] == "openai.embeddings.create"
 
-    assert span["data"][PROMPT_TOKENS] == 20
-    assert span["data"][TOTAL_TOKENS] == 30
+    assert span["data"][PROMPT_TOKENS_USED] == 20
+    assert span["data"][TOTAL_TOKENS_USED] == 30
diff --git a/tox.ini b/tox.ini
@@ -149,6 +149,7 @@ envlist =
     # OpenAI
     {py3.9,py3.11,py3.12}-openai-v1
     {py3.9,py3.11,py3.12}-openai-latest
+    {py3.9,py3.11,py3.12}-openai-without-tiktoken
 
     # OpenTelemetry (OTel)
     {py3.7,py3.9,py3.11,py3.12}-opentelemetry
@@ -444,9 +445,11 @@ deps =
     loguru-latest: loguru
 
     # OpenAI
-    openai: tiktoken
     openai-v1: openai~=1.0.0
+    openai-v1: tiktoken~=0.6.0
     openai-latest: openai
+    openai-latest: tiktoken~=0.6.0
+    openai-without-tiktoken: openai
 
     # OpenTelemetry (OTel)
     opentelemetry: opentelemetry-distro