Merge pull request #679 from LorenzoPaleari/output-parser-update

feat: output parser and pydantic update
2026-06-28 21:01:55 +08:00 · 2024-09-18 09:54:37 +02:00 · 2024-09-18 09:54:37 +02:00 · e6e2ce6db4
commit e6e2ce6db4
parent 4f8b55d747 eb89549248
43 changed files with 137 additions and 138 deletions
--- a/examples/anthropic/search_graph_schema_haiku.py
+++ b/examples/anthropic/search_graph_schema_haiku.py
@ -5,7 +5,7 @@ Example of Search Graph
 import os
 from typing import List
 from dotenv import load_dotenv
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import SearchGraph

 load_dotenv()
--- a/examples/anthropic/smart_scraper_schema_haiku.py
+++ b/examples/anthropic/smart_scraper_schema_haiku.py
@ -4,7 +4,7 @@ Basic example of scraping pipeline using SmartScraper using Azure OpenAI Key

 import os
 from typing import List
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from dotenv import load_dotenv
 from scrapegraphai.graphs import SmartScraperGraph
 from scrapegraphai.utils import prettify_exec_info
--- a/examples/azure/search_graph_schema_azure.py
+++ b/examples/azure/search_graph_schema_azure.py
@ -9,7 +9,7 @@ load_dotenv()
 from scrapegraphai.graphs import SearchGraph
 from scrapegraphai.utils import convert_to_csv, convert_to_json, prettify_exec_info

-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from typing import List

 # ************************************************
--- a/examples/azure/smart_scraper_schema_azure.py
+++ b/examples/azure/smart_scraper_schema_azure.py
@ -5,7 +5,7 @@ Basic example of scraping pipeline using SmartScraper with schema
 import os
 import json
 from typing import List
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from dotenv import load_dotenv
 from scrapegraphai.graphs import SmartScraperGraph

--- a/examples/bedrock/search_graph_schema_bedrock.py
+++ b/examples/bedrock/search_graph_schema_bedrock.py
@ -4,7 +4,7 @@ Example of Search Graph
 from scrapegraphai.graphs import SearchGraph
 from scrapegraphai.utils import convert_to_csv, convert_to_json, prettify_exec_info

-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from typing import List

 # ************************************************
--- a/examples/bedrock/smart_scraper_schema_bedrock.py
+++ b/examples/bedrock/smart_scraper_schema_bedrock.py
@ -2,7 +2,7 @@
 Basic example of scraping pipeline using SmartScraper
 """
 from typing import List
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import SmartScraperGraph
 from scrapegraphai.utils import prettify_exec_info

--- a/examples/deepseek/search_graph_schema_deepseek.py
+++ b/examples/deepseek/search_graph_schema_deepseek.py
@ -9,7 +9,7 @@ load_dotenv()
 from scrapegraphai.graphs import SearchGraph
 from scrapegraphai.utils import convert_to_csv, convert_to_json, prettify_exec_info

-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from typing import List

 # ************************************************
--- a/examples/deepseek/smart_scraper_schema_deepseek.py
+++ b/examples/deepseek/smart_scraper_schema_deepseek.py
@ -4,7 +4,7 @@ Basic example of scraping pipeline using SmartScraper

 import os
 from typing import List
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from dotenv import load_dotenv
 from scrapegraphai.graphs import SmartScraperGraph
 from scrapegraphai.utils import prettify_exec_info
--- a/examples/extras/serch_graph_scehma.py
+++ b/examples/extras/serch_graph_scehma.py
@ -5,7 +5,7 @@ Example of Search Graph
 import os
 from dotenv import load_dotenv
 from scrapegraphai.graphs import SearchGraph
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from typing import List
 load_dotenv()

--- a/examples/fireworks/pdf_scraper_multi_fireworks.py
+++ b/examples/fireworks/pdf_scraper_multi_fireworks.py
@ -5,7 +5,7 @@ import os
 import json
 from typing import List
 from dotenv import load_dotenv
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import PdfScraperMultiGraph

 load_dotenv()
--- a/examples/fireworks/script_generator_schema_fireworks.py
+++ b/examples/fireworks/script_generator_schema_fireworks.py
@ -5,7 +5,7 @@ Basic example of scraping pipeline using ScriptCreatorGraph
 import os
 from typing import List
 from dotenv import load_dotenv
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import ScriptCreatorGraph
 from scrapegraphai.utils import prettify_exec_info

--- a/examples/fireworks/search_graph_schema_fireworks.py
+++ b/examples/fireworks/search_graph_schema_fireworks.py
@ -9,7 +9,7 @@ load_dotenv()
 from scrapegraphai.graphs import SearchGraph
 from scrapegraphai.utils import convert_to_csv, convert_to_json, prettify_exec_info

-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from typing import List

 # ************************************************
--- a/examples/fireworks/smart_scraper_schema_fireworks.py
+++ b/examples/fireworks/smart_scraper_schema_fireworks.py
@ -5,7 +5,7 @@ Basic example of scraping pipeline using SmartScraper with schema
 import os, json
 from typing import List
 from dotenv import load_dotenv
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import SmartScraperGraph

 load_dotenv()
--- a/examples/google_genai/search_graph_schema_gemini.py
+++ b/examples/google_genai/search_graph_schema_gemini.py
@ -9,7 +9,7 @@ load_dotenv()
 from scrapegraphai.graphs import SearchGraph
 from scrapegraphai.utils import convert_to_csv, convert_to_json, prettify_exec_info

-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from typing import List

 # ************************************************
--- a/examples/google_genai/smart_scraper_schema_gemini.py
+++ b/examples/google_genai/smart_scraper_schema_gemini.py
@ -4,7 +4,7 @@ Basic example of scraping pipeline using SmartScraper with schema

 import os
 from typing import List
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from dotenv import load_dotenv
 from scrapegraphai.utils import prettify_exec_info
 from scrapegraphai.graphs import SmartScraperGraph
--- a/examples/google_vertexai/search_graph_schema_gemini.py
+++ b/examples/google_vertexai/search_graph_schema_gemini.py
@ -9,7 +9,7 @@ load_dotenv()
 from scrapegraphai.graphs import SearchGraph
 from scrapegraphai.utils import convert_to_csv, convert_to_json, prettify_exec_info

-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from typing import List

 # ************************************************
--- a/examples/google_vertexai/smart_scraper_schema_gemini.py
+++ b/examples/google_vertexai/smart_scraper_schema_gemini.py
@ -4,7 +4,7 @@ Basic example of scraping pipeline using SmartScraper with schema

 import os
 from typing import List
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from dotenv import load_dotenv
 from scrapegraphai.utils import prettify_exec_info
 from scrapegraphai.graphs import SmartScraperGraph
--- a/examples/groq/search_graph_schema_groq.py
+++ b/examples/groq/search_graph_schema_groq.py
@ -9,7 +9,7 @@ load_dotenv()
 from scrapegraphai.graphs import SearchGraph
 from scrapegraphai.utils import convert_to_csv, convert_to_json, prettify_exec_info

-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from typing import List

 # ************************************************
--- a/examples/groq/smart_scraper_schema_groq.py
+++ b/examples/groq/smart_scraper_schema_groq.py
@ -4,7 +4,7 @@ Basic example of scraping pipeline using SmartScraper with schema

 import os, json
 from typing import List
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from dotenv import load_dotenv
 from scrapegraphai.graphs import SmartScraperGraph
 from scrapegraphai.utils import prettify_exec_info
--- a/examples/integrations/indexify_node_example.py
+++ b/examples/integrations/indexify_node_example.py
@ -8,7 +8,7 @@ from typing import List
 from dotenv import load_dotenv
 load_dotenv()

-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import SmartScraperGraph
 from scrapegraphai.integrations import IndexifyNode

--- a/examples/local_models/search_graph_schema_ollama.py
+++ b/examples/local_models/search_graph_schema_ollama.py
@ -4,7 +4,7 @@ Example of Search Graph
 from scrapegraphai.graphs import SearchGraph
 from scrapegraphai.utils import convert_to_csv, convert_to_json, prettify_exec_info

-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from typing import List

 # ************************************************
--- a/examples/local_models/smart_scraper_schema_ollama.py
+++ b/examples/local_models/smart_scraper_schema_ollama.py
@ -3,7 +3,7 @@ Basic example of scraping pipeline using SmartScraper with schema
 """
 import json
 from typing import List
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import SmartScraperGraph
 from scrapegraphai.utils import prettify_exec_info

--- a/examples/mistral/pdf_scraper_multi_mistral.py
+++ b/examples/mistral/pdf_scraper_multi_mistral.py
@ -5,7 +5,7 @@ import os
 import json
 from typing import List
 from dotenv import load_dotenv
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import PdfScraperMultiGraph

 load_dotenv()
--- a/examples/mistral/script_generator_schema_mistral.py
+++ b/examples/mistral/script_generator_schema_mistral.py
@ -6,7 +6,7 @@ import os
 from dotenv import load_dotenv
 from scrapegraphai.graphs import ScriptCreatorGraph
 from scrapegraphai.utils import prettify_exec_info
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from typing import List

 load_dotenv()
--- a/examples/mistral/search_graph_schema_mistral.py
+++ b/examples/mistral/search_graph_schema_mistral.py
@ -5,7 +5,7 @@ Example of Search Graph
 import os
 from typing import List
 from dotenv import load_dotenv
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import SearchGraph
 from scrapegraphai.utils import convert_to_csv, convert_to_json, prettify_exec_info

--- a/examples/mistral/smart_scraper_schema_mistral.py
+++ b/examples/mistral/smart_scraper_schema_mistral.py
@ -5,7 +5,7 @@ Basic example of scraping pipeline using SmartScraper with schema
 import os, json
 from typing import List
 from dotenv import load_dotenv
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import SmartScraperGraph

 load_dotenv()
--- a/examples/nemotron/script_generator_schema_nemotron.py
+++ b/examples/nemotron/script_generator_schema_nemotron.py
@ -7,7 +7,7 @@ from dotenv import load_dotenv
 from scrapegraphai.graphs import ScriptCreatorGraph
 from scrapegraphai.utils import prettify_exec_info

-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from typing import List

 load_dotenv()
--- a/examples/nemotron/search_graph_schema_nemotron.py
+++ b/examples/nemotron/search_graph_schema_nemotron.py
@ -9,7 +9,7 @@ load_dotenv()
 from scrapegraphai.graphs import SearchGraph
 from scrapegraphai.utils import convert_to_csv, convert_to_json, prettify_exec_info

-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from typing import List

 # ************************************************
--- a/examples/nemotron/smart_scraper_schema_nemotron.py
+++ b/examples/nemotron/smart_scraper_schema_nemotron.py
@ -5,7 +5,7 @@ Basic example of scraping pipeline using SmartScraper with schema
 import os, json
 from typing import List
 from dotenv import load_dotenv
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import SmartScraperGraph

 load_dotenv()
--- a/examples/oneapi/search_graph_schema_oneapi.py
+++ b/examples/oneapi/search_graph_schema_oneapi.py
@ -4,7 +4,7 @@ Example of Search Graph
 from scrapegraphai.graphs import SearchGraph
 from scrapegraphai.utils import convert_to_csv, convert_to_json, prettify_exec_info

-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from typing import List

 # ************************************************
--- a/examples/oneapi/smart_scraper_schema_oneapi.py
+++ b/examples/oneapi/smart_scraper_schema_oneapi.py
@ -2,7 +2,7 @@
 Basic example of scraping pipeline using SmartScraper and OneAPI
 """
 from typing import List
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import SmartScraperGraph
 from scrapegraphai.utils import prettify_exec_info

--- a/examples/openai/pdf_scraper_multi_openai.py
+++ b/examples/openai/pdf_scraper_multi_openai.py
@ -5,7 +5,7 @@ import os
 import json
 from typing import List
 from dotenv import load_dotenv
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import PdfScraperMultiGraph

 load_dotenv()
--- a/examples/openai/script_generator_schema_openai.py
+++ b/examples/openai/script_generator_schema_openai.py
@ -7,7 +7,7 @@ from dotenv import load_dotenv
 from scrapegraphai.graphs import ScriptCreatorGraph
 from scrapegraphai.utils import prettify_exec_info

-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from typing import List

 load_dotenv()
--- a/examples/openai/search_graph_schema_openai.py
+++ b/examples/openai/search_graph_schema_openai.py
@ -5,7 +5,7 @@ Example of Search Graph
 import os
 from typing import List
 from dotenv import load_dotenv
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import SearchGraph
 from scrapegraphai.utils import convert_to_csv, convert_to_json, prettify_exec_info

--- a/examples/openai/smart_scraper_schema_openai.py
+++ b/examples/openai/smart_scraper_schema_openai.py
@ -5,7 +5,7 @@ Basic example of scraping pipeline using SmartScraper with schema
 import os, json
 from typing import List
 from dotenv import load_dotenv
-from langchain_core.pydantic_v1 import BaseModel, Field
+from pydantic import BaseModel, Field
 from scrapegraphai.graphs import SmartScraperGraph

 load_dotenv()
--- a/scrapegraphai/nodes/generate_answer_csv_node.py
+++ b/scrapegraphai/nodes/generate_answer_csv_node.py
@ -3,17 +3,14 @@ Module for generating the answer node
 """

 from typing import List, Optional
-from pydantic.v1 import BaseModel as BaseModelV1
 from langchain.prompts import PromptTemplate
 from langchain_core.output_parsers import JsonOutputParser
 from langchain_core.runnables import RunnableParallel
-from langchain_core.utils.pydantic import is_basemodel_subclass
 from langchain_openai import ChatOpenAI
 from langchain_mistralai import ChatMistralAI
 from tqdm import tqdm
-from ..utils.logging import get_logger
 from .base_node import BaseNode
-from ..utils.llm_output_parser import typed_dict_output_parser, base_model_v2_output_parser, base_model_v1_output_parser
+from ..utils.output_parser import get_structured_output_parser, get_pydantic_output_parser
 from ..prompts import TEMPLATE_CHUKS_CSV, TEMPLATE_NO_CHUKS_CSV, TEMPLATE_MERGE_CSV

 class GenerateAnswerCSVNode(BaseNode):
@ -101,14 +98,10 @@ class GenerateAnswerCSVNode(BaseNode):
                self.llm_model = self.llm_model.with_structured_output(
                    schema = self.node_config["schema"]) # json schema works only on specific models

-                output_parser = typed_dict_output_parser
-                if is_basemodel_subclass(self.node_config["schema"]):
-                    output_parser = base_model_v2_output_parser
-                    if issubclass(self.node_config["schema"], BaseModelV1):
-                        output_parser = base_model_v1_output_parser
+                output_parser = get_structured_output_parser(self.node_config["schema"])
                format_instructions = "NA"
            else:
-                output_parser = JsonOutputParser(pydantic_object=self.node_config["schema"])
+                output_parser = get_pydantic_output_parser(self.node_config["schema"])
                format_instructions = output_parser.get_format_instructions()

        else:
--- a/scrapegraphai/nodes/generate_answer_node.py
+++ b/scrapegraphai/nodes/generate_answer_node.py
@ -2,17 +2,15 @@
 GenerateAnswerNode Module
 """
 from typing import List, Optional
-from pydantic.v1 import BaseModel as BaseModelV1
 from langchain.prompts import PromptTemplate
 from langchain_core.output_parsers import JsonOutputParser
 from langchain_core.runnables import RunnableParallel
-from langchain_core.utils.pydantic import is_basemodel_subclass
 from langchain_openai import ChatOpenAI, AzureChatOpenAI
 from langchain_mistralai import ChatMistralAI
 from langchain_community.chat_models import ChatOllama
 from tqdm import tqdm
 from .base_node import BaseNode
-from ..utils.llm_output_parser import base_model_v1_output_parser, base_model_v2_output_parser, typed_dict_output_parser
+from ..utils.output_parser import get_structured_output_parser, get_pydantic_output_parser
 from ..prompts import (TEMPLATE_CHUNKS,
                       TEMPLATE_NO_CHUNKS, TEMPLATE_MERGE,
                       TEMPLATE_CHUNKS_MD, TEMPLATE_NO_CHUNKS_MD,
@ -95,15 +93,11 @@ class GenerateAnswerNode(BaseNode):
            if isinstance(self.llm_model, (ChatOpenAI, ChatMistralAI)):
                self.llm_model = self.llm_model.with_structured_output(
                    schema = self.node_config["schema"]) # json schema works only on specific models
-
-                output_parser = typed_dict_output_parser
-                if is_basemodel_subclass(self.node_config["schema"]):
-                    output_parser = base_model_v2_output_parser
-                    if issubclass(self.node_config["schema"], BaseModelV1):
-                        output_parser = base_model_v1_output_parser
+                
+                output_parser = get_structured_output_parser(self.node_config["schema"])
                format_instructions = "NA"
            else:
-                output_parser = JsonOutputParser(pydantic_object=self.node_config["schema"])
+                output_parser = get_pydantic_output_parser(self.node_config["schema"])
                format_instructions = output_parser.get_format_instructions()

        else:
--- a/scrapegraphai/nodes/generate_answer_omni_node.py
+++ b/scrapegraphai/nodes/generate_answer_omni_node.py
@ -2,17 +2,15 @@
 GenerateAnswerNode Module
 """
 from typing import List, Optional
-from pydantic.v1 import BaseModel as BaseModelV1
 from langchain.prompts import PromptTemplate
 from langchain_core.output_parsers import JsonOutputParser
 from langchain_core.runnables import RunnableParallel
-from langchain_core.utils.pydantic import is_basemodel_subclass
 from langchain_openai import ChatOpenAI
 from langchain_mistralai import ChatMistralAI
 from tqdm import tqdm
 from langchain_community.chat_models import ChatOllama
 from .base_node import BaseNode
-from ..utils.llm_output_parser import typed_dict_output_parser, base_model_v2_output_parser, base_model_v1_output_parser
+from ..utils.output_parser import get_structured_output_parser, get_pydantic_output_parser
 from ..prompts.generate_answer_node_omni_prompts import (TEMPLATE_NO_CHUNKS_OMNI, 
                                                        TEMPLATE_CHUNKS_OMNI,
                                                        TEMPLATE_MERGE_OMNI)
@ -90,14 +88,10 @@ class GenerateAnswerOmniNode(BaseNode):
                self.llm_model = self.llm_model.with_structured_output(
                    schema = self.node_config["schema"]) # json schema works only on specific models

-                output_parser = typed_dict_output_parser
-                if is_basemodel_subclass(self.node_config["schema"]):
-                    output_parser = base_model_v2_output_parser
-                    if issubclass(self.node_config["schema"], BaseModelV1):
-                        output_parser = base_model_v1_output_parser
+                output_parser = get_structured_output_parser(self.node_config["schema"])
                format_instructions = "NA"
            else:
-                output_parser = JsonOutputParser(pydantic_object=self.node_config["schema"])
+                output_parser = get_pydantic_output_parser(self.node_config["schema"])
                format_instructions = output_parser.get_format_instructions()

        else:
--- a/scrapegraphai/nodes/generate_answer_pdf_node.py
+++ b/scrapegraphai/nodes/generate_answer_pdf_node.py
@ -2,18 +2,15 @@
 Module for generating the answer node
 """
 from typing import List, Optional
-from pydantic.v1 import BaseModel as BaseModelV1
 from langchain.prompts import PromptTemplate
 from langchain_core.output_parsers import JsonOutputParser
 from langchain_core.runnables import RunnableParallel
-from langchain_core.utils.pydantic import is_basemodel_subclass
 from langchain_openai import ChatOpenAI
 from langchain_mistralai import ChatMistralAI
 from tqdm import tqdm
 from langchain_community.chat_models import ChatOllama
-from ..utils.logging import get_logger
 from .base_node import BaseNode
-from ..utils.llm_output_parser import typed_dict_output_parser, base_model_v2_output_parser, base_model_v1_output_parser
+from ..utils.output_parser import get_structured_output_parser, get_pydantic_output_parser
 from ..prompts.generate_answer_node_pdf_prompts import (TEMPLATE_CHUNKS_PDF,
                                                        TEMPLATE_NO_CHUNKS_PDF,
                                                        TEMPLATE_MERGE_PDF)
@ -102,14 +99,10 @@ class GenerateAnswerPDFNode(BaseNode):
                self.llm_model = self.llm_model.with_structured_output(
                    schema = self.node_config["schema"]) # json schema works only on specific models

-                output_parser = typed_dict_output_parser
-                if is_basemodel_subclass(self.node_config["schema"]):
-                    output_parser = base_model_v2_output_parser
-                    if issubclass(self.node_config["schema"], BaseModelV1):
-                        output_parser = base_model_v1_output_parser
+                output_parser = get_structured_output_parser(self.node_config["schema"])
                format_instructions = "NA"
            else:
-                output_parser = JsonOutputParser(pydantic_object=self.node_config["schema"])
+                output_parser = get_pydantic_output_parser(self.node_config["schema"])
                format_instructions = output_parser.get_format_instructions()

        else:
--- a/scrapegraphai/nodes/graph_iterator_node.py
+++ b/scrapegraphai/nodes/graph_iterator_node.py
@ -5,7 +5,7 @@ import asyncio
 from typing import List, Optional
 from tqdm.asyncio import tqdm
 from .base_node import BaseNode
-from langchain_core.pydantic_v1 import BaseModel
+from pydantic import BaseModel

 DEFAULT_BATCHSIZE = 16

--- a/scrapegraphai/nodes/merge_answers_node.py
+++ b/scrapegraphai/nodes/merge_answers_node.py
@ -2,16 +2,13 @@
 MergeAnswersNode Module
 """
 from typing import List, Optional
-from pydantic.v1 import BaseModel as BaseModelV1
 from langchain.prompts import PromptTemplate
 from langchain_core.output_parsers import JsonOutputParser
-from langchain_core.utils.pydantic import is_basemodel_subclass
 from langchain_openai import ChatOpenAI
 from langchain_mistralai import ChatMistralAI
-from ..utils.logging import get_logger
 from .base_node import BaseNode
 from ..prompts import TEMPLATE_COMBINED
-from ..utils.llm_output_parser import base_model_v1_output_parser, base_model_v2_output_parser, typed_dict_output_parser
+from ..utils.output_parser import get_structured_output_parser, get_pydantic_output_parser

 class MergeAnswersNode(BaseNode):
    """
@ -78,14 +75,10 @@ class MergeAnswersNode(BaseNode):
                self.llm_model = self.llm_model.with_structured_output(
                    schema = self.node_config["schema"]) # json schema works only on specific models

-                output_parser = typed_dict_output_parser
-                if is_basemodel_subclass(self.node_config["schema"]):
-                    output_parser = base_model_v2_output_parser
-                    if issubclass(self.node_config["schema"], BaseModelV1):
-                        output_parser = base_model_v1_output_parser
+                output_parser = get_structured_output_parser(self.node_config["schema"])
                format_instructions = "NA"
            else:
-                output_parser = JsonOutputParser(pydantic_object=self.node_config["schema"])
+                output_parser = get_pydantic_output_parser(self.node_config["schema"])
                format_instructions = output_parser.get_format_instructions()

        else:
--- a/scrapegraphai/utils/llm_output_parser.py
+++ b/scrapegraphai/utils/llm_output_parser.py
@ -1,53 +0,0 @@
-"""
-Custom output parser for the LLM model.
-"""
-from pydantic import BaseModel as BaseModelV2
-from pydantic.v1 import BaseModel as BaseModelV1
-
-def base_model_v1_output_parser(x: BaseModelV1) -> dict:
-    """
-    Parse the output of an LLM when the schema is a BaseModelv1 and `with_structured_output` is used.
-
-    Args:
-        x (BaseModelV2 | BaseModelV1): The output from the LLM model.
-
-    Returns:
-        dict: The parsed output.
-    """
-    work_dict = x.dict()
-    
-    # recursive dict parser
-    def recursive_dict_parser(work_dict: dict) -> dict:
-        dict_keys = work_dict.keys()
-        for key in dict_keys:
-            if isinstance(work_dict[key], BaseModelV1):
-                work_dict[key] = work_dict[key].dict()
-                recursive_dict_parser(work_dict[key])
-        return work_dict
-    
-    return recursive_dict_parser(work_dict)
-
-
-def base_model_v2_output_parser(x: BaseModelV2) -> dict:
-    """
-    Parse the output of an LLM when the schema is a BaseModelv2 and `with_structured_output` is used.
-
-    Args:
-        x (BaseModelV2): The output from the LLM model.
-
-    Returns:
-        dict: The parsed output.
-    """
-    return x.model_dump()
-
-def typed_dict_output_parser(x: dict) -> dict:
-    """
-    Parse the output of an LLM when the schema is a TypedDict and `with_structured_output` is used.
-
-    Args:
-        x (dict): The output from the LLM model.
-
-    Returns:
-        dict: The parsed output.
-    """
-    return x
--- a/scrapegraphai/utils/output_parser.py
+++ b/scrapegraphai/utils/output_parser.py
@ -0,0 +1,85 @@
+"""
+Functions to retrieve the correct output parser and format instructions for the LLM model.
+"""
+from pydantic import BaseModel as BaseModelV2
+from pydantic.v1 import BaseModel as BaseModelV1
+from typing import Union, Dict, Any, Type, Callable
+from langchain_core.output_parsers import JsonOutputParser
+
+def get_structured_output_parser(schema: Union[Dict[str, Any], Type[BaseModelV1 | BaseModelV2], Type]) -> Callable:
+    """
+    Get the correct output parser for the LLM model.
+
+    Returns:
+        Callable: The output parser function.
+    """
+    if issubclass(schema, BaseModelV1):
+        return _base_model_v1_output_parser
+    
+    if issubclass(schema, BaseModelV2):
+        return _base_model_v2_output_parser
+
+    return _dict_output_parser
+
+def get_pydantic_output_parser(schema: Union[Dict[str, Any], Type[BaseModelV1 | BaseModelV2], Type]) -> JsonOutputParser:
+    """
+    Get the correct output parser for the LLM model.
+
+    Returns:
+        JsonOutputParser: The output parser object.
+    """
+    if issubclass(schema, BaseModelV1):
+        raise ValueError("pydantic.v1 and langchain_core.pydantic_v1 are not supported with this LLM model. Please use pydantic v2 instead.")
+    
+    if issubclass(schema, BaseModelV2):
+        return JsonOutputParser(pydantic_object=schema)
+
+    raise ValueError("The schema is not a pydantic subclass. With this LLM model you must use a pydantic schemas.")
+
+def _base_model_v1_output_parser(x: BaseModelV1) -> dict:
+    """
+    Parse the output of an LLM when the schema is BaseModelv1.
+
+    Args:
+        x (BaseModelV1): The output from the LLM model.
+
+    Returns:
+        dict: The parsed output.
+    """
+    work_dict = x.dict()
+    
+    # recursive dict parser
+    def recursive_dict_parser(work_dict: dict) -> dict:
+        dict_keys = work_dict.keys()
+        for key in dict_keys:
+            if isinstance(work_dict[key], BaseModelV1):
+                work_dict[key] = work_dict[key].dict()
+                recursive_dict_parser(work_dict[key])
+        return work_dict
+    
+    return recursive_dict_parser(work_dict)
+
+
+def _base_model_v2_output_parser(x: BaseModelV2) -> dict:
+    """
+    Parse the output of an LLM when the schema is BaseModelv2.
+
+    Args:
+        x (BaseModelV2): The output from the LLM model.
+
+    Returns:
+        dict: The parsed output.
+    """
+    return x.model_dump()
+
+def _dict_output_parser(x: dict) -> dict:
+    """
+    Parse the output of an LLM when the schema is TypedDict or JsonSchema.
+
+    Args:
+        x (dict): The output from the LLM model.
+
+    Returns:
+        dict: The parsed output.
+    """
+    return x