feat: fetch_node improved

2026-06-28 21:01:55 +08:00 · 2024-09-07 09:33:57 +02:00 · 2024-09-07 09:33:57 +02:00 · 167f97040f
commit 167f97040f
parent 8883bced7d
1 changed files with 9 additions and 3 deletions
--- a/scrapegraphai/nodes/fetch_node.py
+++ b/scrapegraphai/nodes/fetch_node.py
@ -285,8 +285,14 @@ class FetchNode(BaseNode):
                                    metadata={"source": source}) for content in data]
            elif self.scrape_do is not None:
                from ..docloaders.scrape_do import scrape_do_fetch
-                data =  scrape_do_fetch(self.scrape_do.get("api_key"),
-                                            source)
+                if self.scrape_do.get("use_proxy") is None or self.scrape_do.get("geoCode") is None or self.scrape_do.get("super_proxy") is None:
+                    data =  scrape_do_fetch(self.scrape_do.get("api_key"),
+                                                source)
+                else:
+                    data =  scrape_do_fetch(self.scrape_do.get("api_key"),
+                                                source, self.scrape_do.get("use_proxy"),
+                                                self.scrape_do.get("geoCode"),
+                                                self.scrape_do.get("super_proxy"))

                document = [Document(page_content=data,
                                    metadata={"source": source})]
@ -295,7 +301,7 @@ class FetchNode(BaseNode):
                document = loader.load()

            if not document or not document[0].page_content.strip():
-                raise ValueError("""No HTML body content found in 
+                raise ValueError("""No HTML body content found in
                                 the document fetched by ChromiumLoader.""")
            parsed_content = document[0].page_content