Revert the multifile upload

praveshkumar1988 · praveshkumar1988 · commit cb642a4e0261 · 2024-01-30T18:06:49.000+05:30
diff --git a/backend/score.py b/backend/score.py
@@ -29,8 +29,8 @@ def sick():
 
 
 @app.post('/extract')
-async def extract_graph_from_file(uri= Form(), userName= Form(), password= Form(), files: List[UploadFile] = File(...)):
-    return extract_graph_from_file(uri, userName, password, files)
+async def extract_graph_from_file(uri= Form(), userName= Form(), password= Form(), file: UploadFile = File(...)):
+    return extract_graph_from_file(uri, userName, password, file)
 
 @app.get('/sources_list')
 async def get_source_list():
diff --git a/backend/src/main.py b/backend/src/main.py
@@ -19,58 +19,58 @@
 graph = Neo4jGraph();
 
 
-def extract_graph_from_file(uri, userName, password, files):
+def extract_graph_from_file(uri, userName, password, file):
   try:
-    for file in files:
-      start_time = datetime.now()
-      job_status = "In-Progess"
-      file_type = file.filename.split('.')[1]
-      file_size = round(file.size/(1<<10), 2)
-      file_name = file.filename
+    start_time = datetime.now()
+    job_status = "In-Progess"
+    file_type = file.filename.split('.')[1]
+    file_size = round(file.size/(1<<10), 2)
+    file_name = file.filename
 
-      diffbot_api_key = os.environ.get('DIFFBOT_API_KEY')
-      diffbot_nlp = DiffbotGraphTransformer(diffbot_api_key=diffbot_api_key)
-      
-      graph = Neo4jGraph(url=uri, username=userName, password=password)
+    diffbot_api_key = os.environ.get('DIFFBOT_API_KEY')
+    diffbot_nlp = DiffbotGraphTransformer(diffbot_api_key=diffbot_api_key)
+    
+    graph = Neo4jGraph(url=uri, username=userName, password=password)
 
-      metadata = {"source": "local","filename": file.filename, "filesize":file.size }
-      
-      source_node = "fileName: '{}'"
-      update_node_prop = "SET s.fileSize = '{} KB', s.fileType = '{}' ,s.createdAt ='{}',s.status = '{}',s.nodeCount= 0, s.relationshipCount = 0"
-      #create source node as file name if not exist
-      graph.query('MERGE(s:Source {'+source_node.format(file_name)+'}) '+update_node_prop.format(file_size,file_type,start_time,job_status))
+    metadata = {"source": "local","filename": file.filename, "filesize":file.size }
+    
+    source_node = "fileName: '{}'"
+    update_node_prop = "SET s.fileSize = '{} KB', s.fileType = '{}' ,s.createdAt ='{}',s.status = '{}',s.nodeCount= 0, s.relationshipCount = 0"
+    #create source node as file name if not exist
+    graph.query('MERGE(s:Source {'+source_node.format(file_name)+'}) '+update_node_prop.format(file_size,file_type,start_time,job_status))
 
-      with open('temp.pdf','wb') as f:
-        f.write(file.file.read())
-      loader = PyPDFLoader('temp.pdf')
-      pages = loader.load_and_split()
-      
-      for i in range(0,len(pages)):
-        pages[i]=Document(page_content=pages[i].page_content.replace('\n',' '), metadata=metadata)
-      
-      graph_documents = diffbot_nlp.convert_to_graph_documents(pages)
-      # print(graph_documents)
-      graph.add_graph_documents(graph_documents)
+    with open('temp.pdf','wb') as f:
+      f.write(file.file.read())
+    loader = PyPDFLoader('temp.pdf')
+    pages = loader.load_and_split()
+    
+    for i in range(0,len(pages)):
+      pages[i]=Document(page_content=pages[i].page_content.replace('\n',' '), metadata=metadata)
+    
+    graph_documents = diffbot_nlp.convert_to_graph_documents(pages)
+    # print(graph_documents)
+    graph.add_graph_documents(graph_documents)
 
-      graph.refresh_schema()
-      # count the length list of nodes and relationship based on document generated by Diffbot
-      nodes_created =len(graph_documents[0].nodes)
-      relationships_created = len(graph_documents[0].relationships)
-      
-      end_time = datetime.now()
-      processed_time = end_time - start_time
-      job_status = "Completed"
-      error_message =""
+    graph.refresh_schema()
+    # count the length list of nodes and relationship based on document generated by Diffbot
+    nodes_created =len(graph_documents[0].nodes)
+    relationships_created = len(graph_documents[0].relationships)
+    
+    end_time = datetime.now()
+    processed_time = end_time - start_time
+    job_status = "Completed"
+    error_message =""
 
-      update_node_prop = "SET s.fileSize = '{} KB', s.fileType = '{}' ,s.createdAt ='{}', s.updatedAt = '{}', s.processingTime = '{}',s.status = '{}', s.errorMessgae = '{}',s.nodeCount= {}, s.relationshipCount = {}"
-      graph.query('MERGE(s:Source {'+source_node.format(file_name)+'}) '+update_node_prop.format(file_size,file_type,start_time,end_time,round(processed_time.total_seconds(),2),job_status,error_message,nodes_created,relationships_created))
+    update_node_prop = "SET s.fileSize = '{} KB', s.fileType = '{}' ,s.createdAt ='{}', s.updatedAt = '{}', s.processingTime = '{}',s.status = '{}', s.errorMessgae = '{}',s.nodeCount= {}, s.relationshipCount = {}"
+    graph.query('MERGE(s:Source {'+source_node.format(file_name)+'}) '+update_node_prop.format(file_size,file_type,start_time,end_time,round(processed_time.total_seconds(),2),job_status,error_message,nodes_created,relationships_created))
 
-      output = {
-          "nodeCount": nodes_created,
-          "relationshipCount": relationships_created,
-          "processingTime": round(processed_time.total_seconds(),2),
-          "status" : job_status
-      }
+    output = {
+        "fileSize":file_size+' KB',
+        "nodeCount": nodes_created,
+        "relationshipCount": relationships_created,
+        "processingTime": round(processed_time.total_seconds(),2),
+        "status" : job_status
+    }
     
     return  JSONResponse(content=jsonable_encoder(output))
   except Exception as e: