push

VinciGit00 · VinciGit00 · commit e21d461710e0 · 2024-08-01T13:16:49.000+02:00
diff --git a/scrapegraphai/docloaders/browser_base.py b/scrapegraphai/docloaders/browser_base.py
@@ -2,8 +2,9 @@
 browserbase integration module 
 """
 from browserbase import Browserbase
+from typing import List
 
-def browser_base_fetch(api_key: str, project_id: str, link: str) -> object:
+def browser_base_fetch(api_key: str, project_id: str, link: List[str]) -> List[str]:
     """
     BrowserBase Fetch
 
@@ -15,7 +16,8 @@ def browser_base_fetch(api_key: str, project_id: str, link: str) -> object:
     - `link`: The URL or link that you want to fetch data from.
 
     It initializes a Browserbase object with the given API key and project ID, 
-    then uses this object to load the specified link. It returns the result of the loading operation.
+    then uses this object to load the specified link. 
+    It returns the result of the loading operation.
 
     Example usage:
 
@@ -41,6 +43,6 @@ def browser_base_fetch(api_key: str, project_id: str, link: str) -> object:
 
     browserbase = Browserbase(api_key=api_key, project_id=project_id)
 
-    result = browserbase.load(link)
+    result = browserbase.load([link])
 
     return result
diff --git a/scrapegraphai/nodes/fetch_node.py b/scrapegraphai/nodes/fetch_node.py
@@ -202,11 +202,10 @@ def execute(self, state):
                 loader_kwargs = self.node_config.get("loader_kwargs", {})
 
             if self.browser_base is not None:
-                document = [
-                Document(page_content= browser_base_fetch(self.browser_base.get("api_key"),
-                                                          self.browser_base.get("project_id"), source),
-                         metadata={})
-            ]
+                data =  browser_base_fetch(self.browser_base.get("api_key"),
+                                                          self.browser_base.get("project_id"), source)
+
+                document = [Document(page_content= data, metadata={"source": "html file"})]
             else:
                 loader = ChromiumLoader([source], headless=self.headless, **loader_kwargs)
                 document = loader.load()