neo4j-labs · kaustubh-darekar · Dec 3, 2025 · Dec 4, 2025 · Dec 4, 2025 · Dec 5, 2025
diff --git a/README.md b/README.md
@@ -63,7 +63,7 @@ Run the application using the default `docker-compose` configuration.
    - By default, only OpenAI and Diffbot are enabled. Gemini requires additional GCP configurations. 
    - Use the `VITE_LLM_MODELS_PROD` variable to configure the models you need. Example:
      ```bash
-     VITE_LLM_MODELS_PROD="openai_gpt_4o,openai_gpt_4o_mini,diffbot,gemini_1.5_flash"
+     VITE_LLM_MODELS_PROD="openai_gpt_5.1,openai_gpt_5_mini,diffbot,gemini_2.5_flash"
      ```
 
 2. **Input Sources**: 
@@ -199,10 +199,10 @@ VITE_BACKEND_API_URL=${VITE_BACKEND_API_URL-backendurl}
 | DUPLICATE_TEXT_DISTANCE | Mandatory            | 5 | This value used to find distance for all node pairs in the graph and calculated based on node properties    |
 | DUPLICATE_SCORE_VALUE   | Mandatory            | 0.97 | Node score value to match duplicate node                                                                 |
 | EFFECTIVE_SEARCH_RATIO  | Mandatory            | 1 |                 |
-| GRAPH_CLEANUP_MODEL     | Optional            | 0.97 |  Model name to clean-up graph in post processing                                                           |
+| GRAPH_CLEANUP_MODEL     | Optional            | "openai_gpt_5_mini" |  Model name to clean-up graph in post processing                                                           |
 | MAX_TOKEN_CHUNK_SIZE    | Optional            | 10000 | Maximum token size to process file content                                                               |
 | YOUTUBE_TRANSCRIPT_PROXY| Optional            |   | Proxy key to process youtube video for getting transcript                                                   |
-| EMBEDDING_MODEL         | Optional            | all-MiniLM-L6-v2 | Model for generating the text embedding (all-MiniLM-L6-v2 , openai , vertexai)                |
+| EMBEDDING_MODEL         | Optional            |               | Model for generating the text embedding (default all-MiniLM-L6-v2 , openai , vertexai, titan)                |
 | IS_EMBEDDING            | Optional            | true          | Flag to enable text embedding                                                                    |
 | KNN_MIN_SCORE           | Optional            | 0.94          | Minimum score for KNN algorithm                                                                  |
 | GEMINI_ENABLED          | Optional            | False         | Flag to enable Gemini                                                                             |
@@ -219,7 +219,7 @@ VITE_BACKEND_API_URL=${VITE_BACKEND_API_URL-backendurl}
 | LANGCHAIN_ENDPOINT      | Optional            | https://api.smith.langchain.com | Endpoint for Langchain API                                                            |
 | ENTITY_EMBEDDING        | Optional            | False         | If set to True, It will add embeddings for each entity in database |
 | LLM_MODEL_CONFIG_ollama_<model_name>          | Optional      |               | Set ollama config as - model_name,model_local_url for local deployments |
-| RAGAS_EMBEDDING_MODEL         | Optional      | openai              | embedding model used by ragas evaluation framework                               |
+| RAGAS_EMBEDDING_MODEL         | Optional      |               | embedding model used by ragas evaluation framework                               |
 |                                                                                                                                                                        |
 | **FRONTEND ENV** 
 | VITE_BLOOM_URL               | Mandatory           | https://workspace-preview.neo4j.io/workspace/explore?connectURL={CONNECT_URL}&search=Show+me+a+graph&featureGenAISuggestions=true&featureGenAISuggestionsInternal=true | URL for Bloom visualization |

diff --git a/backend/example.env b/backend/example.env
@@ -1,10 +1,10 @@
 OPENAI_API_KEY = ""   #This is required if you are using openai embedding model
-EMBEDDING_MODEL = "all-MiniLM-L6-v2"  #this can be openai or vertexai or by default all-MiniLM-L6-v2
-RAGAS_EMBEDDING_MODEL = "openai"  #Keep blank if you want to use all-MiniLM-L6-v2 for ragas embeddings
+EMBEDDING_MODEL = ""  #values can be blank or "openai" or "vertexai" "titan" - defaults to all-MiniLM-L6-v2
+RAGAS_EMBEDDING_MODEL = ""  #values can be blank or "openai"
 IS_EMBEDDING = "TRUE"   
 KNN_MIN_SCORE = "0.94"
 # Enable Gemini (default is False) | Can be False or True
-GEMINI_ENABLED = False
+GEMINI_ENABLED = "False"     #Keep true if you are using gemini model
 # Enable Google Cloud logs (default is False) | Can be False or True
 GCP_LOG_METRICS_ENABLED = False
 NUMBER_OF_CHUNKS_TO_COMBINE = 6
@@ -19,7 +19,7 @@ LANGCHAIN_API_KEY = ""
 LANGCHAIN_PROJECT = ""
 LANGCHAIN_TRACING_V2 = ""
 LANGCHAIN_ENDPOINT = ""
-GCS_FILE_CACHE = "" #save the file into GCS or local, SHould be True or False
+GCS_FILE_CACHE = "" #save the file into GCS or local, Should be True or False
 NEO4J_USER_AGENT=""
 ENABLE_USER_AGENT = ""
 LLM_MODEL_CONFIG_model_version=""
@@ -28,30 +28,26 @@ DUPLICATE_SCORE_VALUE =0.97
 DUPLICATE_TEXT_DISTANCE =3
 DEFAULT_DIFFBOT_CHAT_MODEL="openai_gpt_4o"  #whichever model specified here , need to add config for that model in below format)
-DEFAULT_DIFFBOT_CHAT_MODEL="openai_gpt_4o"  #whichever model specified here , need to add config for that model in below format)
+DEFAULT_DIFFBOT_CHAT_MODEL="openai_gpt_5_mini"  #whichever model specified here , need to add config for that model in below format)
-DEFAULT_DIFFBOT_CHAT_MODEL="openai_gpt_4o"  #whichever model specified here , need to add config for that model in below format)
+DEFAULT_DIFFBOT_CHAT_MODEL="openai_gpt_5_mini"  #whichever model specified here , need to add config for that model in below format)
 #examples
-LLM_MODEL_CONFIG_openai_gpt_3.5="gpt-3.5-turbo-0125,openai_api_key"
-LLM_MODEL_CONFIG_openai_gpt_4o_mini="gpt-4o-mini-2024-07-18,openai_api_key"
-LLM_MODEL_CONFIG_openai_gpt_4o="gpt-4o-2024-11-20,openai_api_key"
-LLM_MODEL_CONFIG_openai_gpt_4.1_mini="gpt-4.1-mini,openai_api_key"
-LLM_MODEL_CONFIG_openai_gpt_4.1="gpt-4.1,openai_api_key"
-LLM_MODEL_CONFIG_openai_gpt_o3_mini="o3-mini-2025-01-31,openai_api_key"
-LLM_MODEL_CONFIG_gemini_1.5_pro="gemini-1.5-pro-002"
-LLM_MODEL_CONFIG_gemini_1.5_flash="gemini-1.5-flash-002"
-LLM_MODEL_CONFIG_gemini_2.0_flash="gemini-2.0-flash-001"
+LLM_MODEL_CONFIG_openai_gpt_5.1="gpt-5.1,openai-key"
+LLM_MODEL_CONFIG_openai_gpt_5_mini="gpt-5-mini,openai-key"
+LLM_MODEL_CONFIG_openai_gpt_4.1="gpt-4.1,openai-key"
+LLM_MODEL_CONFIG_openai_gpt_4.1_mini="gpt-4.1-mini,openai-key"
+LLM_MODEL_CONFIG_gemini_2.5_flash="gemini-2.5-flash"
 LLM_MODEL_CONFIG_gemini_2.5_pro="gemini-2.5-pro"
 LLM_MODEL_CONFIG_diffbot="diffbot,diffbot_api_key"
-LLM_MODEL_CONFIG_azure_ai_gpt_35="azure_deployment_name,azure_endpoint or base_url,azure_api_key,api_version"
+LLM_MODEL_CONFIG_groq_llama3.1_8b="llama-3.1-8b-instant,base_url,groq_api_key"
-LLM_MODEL_CONFIG_groq_llama3.1_8b="llama-3.1-8b-instant,base_url,groq_api_key"
+LLM_MODEL_CONFIG_groq_llama3.1_8b="llama-3.1-8b-instant,base_url,groq_api_key"
+# Note: The constant name 'anthropic_claude_4.5_sonnet' maps to the model identifier 'claude-sonnet-4-5-20250929' as used by Anthropic.
-LLM_MODEL_CONFIG_groq_llama3.1_8b="llama-3.1-8b-instant,base_url,groq_api_key"
+LLM_MODEL_CONFIG_groq_llama3.1_8b="llama-3.1-8b-instant,base_url,groq_api_key"
+# Note: The constant name 'anthropic_claude_4.5_sonnet' maps to the model identifier 'claude-sonnet-4-5-20250929' as used by Anthropic.
+LLM_MODEL_CONFIG_anthropic_claude_4.5_sonnet="claude-sonnet-4-5-20250929,anthropic_api_key"
+LLM_MODEL_CONFIG_llama4_maverick="Llama-4-Maverick-17B-128E-Instruct-FP8,https://api.llama.com/compat/v1/,LLM|1207839134334841|NT9iYvy201sMmsOJB6spkslwoiM"
 LLM_MODEL_CONFIG_azure_ai_gpt_4o="gpt-4o,https://YOUR-ENDPOINT.openai.azure.com/,azure_api_key,api_version"
-LLM_MODEL_CONFIG_groq_llama3_70b="model_name,base_url,groq_api_key"
-LLM_MODEL_CONFIG_anthropic_claude_4_sonnet="model_name,anthropic_api_key"    #model_name="claude-sonnet-4-20250514"
-LLM_MODEL_CONFIG_fireworks_llama4_maverick="model_name,fireworks_api_key"
+LLM_MODEL_CONFIG_fireworks_qwen3_30b="accounts/fireworks/models/qwen3-30b-a3b,fireworks_api_key"
+LLM_MODEL_CONFIG_fireworks_gpt_oss="accounts/fireworks/models/gpt-oss-120b,fireworks_api_key"
+LLM_MODEL_CONFIG_fireworks_deepseek_v3="accounts/fireworks/models/deepseek-v3p1,fireworks_api_key"
+LLM_MODEL_CONFIG_bedrock_nova_micro_v1="amazon.nova-micro-v1:0,aws_access_key,aws_secret_key,region_name"
+LLM_MODEL_CONFIG_bedrock_nova_lite_v1="amazon.nova-lite-v1:0,aws_access_key,aws_secret_key,region_name"
+LLM_MODEL_CONFIG_bedrock_nova_pro_v1="amazon.nova-pro-v1:0,aws_access_key,aws_secret_key,region_name"
 LLM_MODEL_CONFIG_ollama_llama3="llama3_model_name,model_local_url"
 YOUTUBE_TRANSCRIPT_PROXY="https://user:pass@domain:port"
 EFFECTIVE_SEARCH_RATIO=5
-GRAPH_CLEANUP_MODEL="openai_gpt_4o"
-BEDROCK_EMBEDDING_MODEL="model_name,aws_access_key,aws_secret_key,region_name"                       #model_name="amazon.titan-embed-text-v1"
-LLM_MODEL_CONFIG_bedrock_nova_micro_v1="model_name,aws_access_key,aws_secret_key,region_name"        #model_name="amazon.nova-micro-v1:0"
-LLM_MODEL_CONFIG_bedrock_nova_lite_v1="model_name,aws_access_key,aws_secret_key,region_name"         #model_name="amazon.nova-lite-v1:0"
-LLM_MODEL_CONFIG_bedrock_nova_pro_v1="model_name,aws_access_key,aws_secret_key,region_name"          #model_name="amazon.nova-pro-v1:0"
-LLM_MODEL_CONFIG_fireworks_deepseek_r1="model_name,fireworks_api_key"      #model_name="accounts/fireworks/models/deepseek-r1"
-LLM_MODEL_CONFIG_fireworks_deepseek_v3="model_name,fireworks_api_key"      #model_name="accounts/fireworks/models/deepseek-v3"
+GRAPH_CLEANUP_MODEL="openai_gpt_5_mini"
+BEDROCK_EMBEDDING_MODEL="model_name,aws_access_key,aws_secret_key,region_name"                       #model_name="amazon.titan-embed-text-v2.0"
 MAX_TOKEN_CHUNK_SIZE=2000 #Max token used to process/extract the file content.
diff --git a/backend/score.py b/backend/score.py
@@ -112,9 +112,9 @@ async def __call__(self, scope: Scope, receive: Receive, send: Send):
 )
 app.add_middleware(SessionMiddleware, secret_key=os.urandom(24))
 
-is_gemini_enabled = os.environ.get("GEMINI_ENABLED", "False").lower() in ("true", "1", "yes")
-if is_gemini_enabled:
-    add_routes(app,ChatVertexAI(), path="/vertexai")
+# is_gemini_enabled = os.environ.get("GEMINI_ENABLED", "False").lower() in ("true", "1", "yes")
+# if is_gemini_enabled:
+#     add_routes(app,ChatVertexAI(), path="/vertexai")
-# is_gemini_enabled = os.environ.get("GEMINI_ENABLED", "False").lower() in ("true", "1", "yes")
-# if is_gemini_enabled:
-#     add_routes(app,ChatVertexAI(), path="/vertexai")
+is_gemini_enabled = os.environ.get("GEMINI_ENABLED", "False").lower() in ("true", "1", "yes")
+if is_gemini_enabled:
+    add_routes(app, ChatVertexAI(), path="/vertexai")
-# is_gemini_enabled = os.environ.get("GEMINI_ENABLED", "False").lower() in ("true", "1", "yes")
-# if is_gemini_enabled:
-#     add_routes(app,ChatVertexAI(), path="/vertexai")
-# is_gemini_enabled = os.environ.get("GEMINI_ENABLED", "False").lower() in ("true", "1", "yes")
-# if is_gemini_enabled:
-#     add_routes(app,ChatVertexAI(), path="/vertexai")
+is_gemini_enabled = os.environ.get("GEMINI_ENABLED", "False").lower() in ("true", "1", "yes")
+if is_gemini_enabled:
+    add_routes(app, ChatVertexAI(), path="/vertexai")
-# is_gemini_enabled = os.environ.get("GEMINI_ENABLED", "False").lower() in ("true", "1", "yes")
-# if is_gemini_enabled:
-#     add_routes(app,ChatVertexAI(), path="/vertexai")
 
 app.add_api_route("/health", health([healthy_condition, healthy]))
 

diff --git a/backend/src/communities.py b/backend/src/communities.py
@@ -14,7 +14,7 @@
 MAX_WORKERS = 10
 MAX_COMMUNITY_LEVELS = 3 
 MIN_COMMUNITY_SIZE = 1 
-COMMUNITY_CREATION_DEFAULT_MODEL = "openai_gpt_4o"
+COMMUNITY_CREATION_DEFAULT_MODEL = "openai_gpt_4.1"
 
 
 CREATE_COMMUNITY_GRAPH_PROJECTION = """

diff --git a/backend/src/graphDB_dataAccess.py b/backend/src/graphDB_dataAccess.py
@@ -239,7 +239,6 @@ def connection_check_and_get_vector_dimensions(self,database):
 
         embedding_model = os.getenv('EMBEDDING_MODEL')
         embeddings, application_dimension = load_embedding_model(embedding_model)
-        logging.info(f'embedding model:{embeddings} and dimesion:{application_dimension}')
 
         gds_status = self.check_gds_version()
         write_access = self.check_account_access(database=database)

diff --git a/backend/src/llm.py b/backend/src/llm.py
@@ -50,7 +50,7 @@ def get_llm(model: str):
             )
         elif "openai" in model:
             model_name, api_key = env_value.split(",")
-            if "o3-mini" in model:
+            if "mini" in model:
-            if "mini" in model:
+            # Only match specific "mini" models to avoid accidental matches (e.g., "gemini")
+            if re.search(r'(^|\W)(o3-mini|gpt-4\.1-mini|gpt-5-mini)($|\W)', model):
-            if "mini" in model:
+            # Only match specific "mini" models to avoid accidental matches (e.g., "gemini")
+            if re.search(r'(^|\W)(o3-mini|gpt-4\.1-mini|gpt-5-mini)($|\W)', model):
                 llm= ChatOpenAI(
                 api_key=api_key,
                 model=model_name)
@@ -189,17 +189,14 @@ async def get_graph_document_list(
         else:
             node_properties = ["description"]
             relationship_properties = ["description"]
-        TOOL_SUPPORTED_MODELS = {"qwen3", "deepseek"} 
         model_name = get_llm_model_name(llm)
-        ignore_tool_usage = not any(pattern in model_name for pattern in TOOL_SUPPORTED_MODELS)
-        logging.info(f"Keeping ignore tool usage parameter as {ignore_tool_usage}")
         llm_transformer = LLMGraphTransformer(
             llm=llm,
             node_properties=node_properties,
             relationship_properties=relationship_properties,
             allowed_nodes=allowedNodes,
             allowed_relationships=allowedRelationship,
-            ignore_tool_usage=ignore_tool_usage,
+            ignore_tool_usage=True,
             additional_instructions=ADDITIONAL_INSTRUCTIONS+ (additional_instructions if additional_instructions else "")
         )
 

diff --git a/backend/src/post_processing.py b/backend/src/post_processing.py
@@ -204,7 +204,7 @@ def graph_schema_consolidation(graph):
         messages=[("system", GRAPH_CLEANUP_PROMPT), ("human", "{input}")],
         partial_variables={"format_instructions": parser.get_format_instructions()}
     )
-    graph_cleanup_model = os.getenv("GRAPH_CLEANUP_MODEL", 'openai_gpt_4o')
+    graph_cleanup_model = os.getenv("GRAPH_CLEANUP_MODEL")
-    graph_cleanup_model = os.getenv("GRAPH_CLEANUP_MODEL")
+    graph_cleanup_model = os.getenv("GRAPH_CLEANUP_MODEL", "gpt-3.5-turbo")
-    graph_cleanup_model = os.getenv("GRAPH_CLEANUP_MODEL")
+    graph_cleanup_model = os.getenv("GRAPH_CLEANUP_MODEL", "gpt-3.5-turbo")
     llm, _ = get_llm(graph_cleanup_model)
     chain = prompt | llm | parser
 

diff --git a/backend/src/shared/common_fn.py b/backend/src/shared/common_fn.py
@@ -113,13 +113,13 @@ def load_embedding_model(embedding_model_name: str):
         logging.info(f"Embedding: Using OpenAI Embeddings , Dimension:{dimension}")
     elif embedding_model_name == "vertexai":        
         embeddings = VertexAIEmbeddings(
-            model="textembedding-gecko@003"
+            model="gemini-embedding-001"
         )
-        dimension = 768
+        dimension = 3072
-        dimension = 3072
+        dimension = 768
-        dimension = 3072
+        dimension = 768
         logging.info(f"Embedding: Using Vertex AI Embeddings , Dimension:{dimension}")
     elif embedding_model_name == "titan":
         embeddings = get_bedrock_embeddings()
-        dimension = 1536
+        dimension = 1024
         logging.info(f"Embedding: Using bedrock titan Embeddings , Dimension:{dimension}")
     else:
         # embeddings = HuggingFaceEmbeddings(model_name="./local_model")