From 10fc4e1beeb2292cd2d49170224df9fe2fca0933 Mon Sep 17 00:00:00 2001
From: Ishaan Samantray <ishaansamantray@Ishaans-MacBook-Pro.local>
Date: Tue, 26 May 2026 14:34:47 -0400
Subject: [PATCH] fix: singleton WorkflowService and mark task failed on load
 error

Two logic bugs in the workflow backend:

1. get_service() created a *new* WorkflowService instance on every HTTP
   request.  Because active_tasks / workflow_tasks / cancel_events are
   stored on the instance, any follow-up request (status poll, cancel,
   log fetch) hit a fresh empty service and got 404 / "Task not found".
   Fixed by promoting the instance to a module-level singleton.

2. When Workflow.load_from_file raised an exception the handler called
   print() and returned without updating active_tasks[task_id].status,
   leaving the task permanently stuck as "running". The caller could
   never know the workflow failed to start. Fixed by setting status to
   "failed", populating the error field, and routing the message through
   the structured log instead of stdout.
---
 workflows/backend/routers.py                  |   7 +-
 workflows/backend/service.py                  |   4 +-
 ...test_service_singleton_and_load_failure.py | 222 ++++++++++++++++++
 3 files changed, 231 insertions(+), 2 deletions(-)
 create mode 100644 workflows/backend/tests/test_service_singleton_and_load_failure.py

diff --git a/workflows/backend/routers.py b/workflows/backend/routers.py
index be8c6c9b..6a839a18 100644
--- a/workflows/backend/routers.py
+++ b/workflows/backend/routers.py
@@ -18,9 +18,14 @@
 
 router = APIRouter(prefix='/api/workflows')
 
+_service_instance: WorkflowService | None = None
+
 
 def get_service() -> WorkflowService:
-	return WorkflowService()
+	global _service_instance
+	if _service_instance is None:
+		_service_instance = WorkflowService()
+	return _service_instance
 
 
 @router.get('', response_model=WorkflowListResponse)
diff --git a/workflows/backend/service.py b/workflows/backend/service.py
index dc3eaa01..a32392c7 100644
--- a/workflows/backend/service.py
+++ b/workflows/backend/service.py
@@ -187,7 +187,9 @@ async def run_workflow_in_background(
 					str(workflow_path), llm=self.llm_instance, browser=self.browser_instance, controller=self.controller_instance
 				)
 			except Exception as e:
-				print(f'Error loading workflow: {e}')
+				await self._write_log(log_file, f'[{ts}] Error loading workflow: {e}\n')
+				self.active_tasks[task_id].status = 'failed'
+				self.active_tasks[task_id].error = str(e)
 				return
 
 			await self._write_log(log_file, f'[{ts}] Executing workflow...\n')
diff --git a/workflows/backend/tests/test_service_singleton_and_load_failure.py b/workflows/backend/tests/test_service_singleton_and_load_failure.py
new file mode 100644
index 00000000..bfe26883
--- /dev/null
+++ b/workflows/backend/tests/test_service_singleton_and_load_failure.py
@@ -0,0 +1,222 @@
+"""
+Tests for two bugs in the workflow backend service:
+
+1. get_service() singleton — previously returned a *new* WorkflowService on every call,
+   so active_tasks / workflow_tasks / cancel_events were lost between HTTP requests.
+
+2. Workflow load failure — previously the exception handler called print() and returned
+   without marking the task as 'failed', leaving it permanently stuck as 'running'.
+"""
+
+import asyncio
+import importlib
+import sys
+import types
+import unittest
+from pathlib import Path
+from unittest.mock import AsyncMock, MagicMock, patch
+
+
+# ---------------------------------------------------------------------------
+# Minimal stubs for heavy optional deps so the backend module imports cleanly.
+# ---------------------------------------------------------------------------
+
+def _make_stub(name: str):
+    mod = types.ModuleType(name)
+    sys.modules[name] = mod
+    return mod
+
+
+for _name in [
+    "browser_use",
+    "browser_use.browser",
+    "browser_use.browser.browser",
+    "browser_use.llm",
+    "workflow_use",
+    "workflow_use.controller",
+    "workflow_use.controller.service",
+    "workflow_use.workflow",
+    "workflow_use.workflow.service",
+    "aiofiles",
+    "yaml",
+]:
+    if _name not in sys.modules:
+        _make_stub(_name)
+
+# Provide realistic-enough stub objects
+sys.modules["browser_use.browser.browser"].Browser = MagicMock
+sys.modules["browser_use.llm"].ChatBrowserUse = MagicMock
+sys.modules["workflow_use.controller.service"].WorkflowController = MagicMock
+
+_MockWorkflow = MagicMock
+sys.modules["workflow_use.workflow.service"].Workflow = _MockWorkflow
+
+# aiofiles stub that makes open() an async context manager
+_aiofiles_mock = MagicMock()
+_aiofiles_open_cm = MagicMock()
+_aiofiles_file = AsyncMock()
+_aiofiles_file.write = AsyncMock()
+_aiofiles_file.readlines = AsyncMock(return_value=[])
+_aiofiles_file.seek = AsyncMock()
+_aiofiles_open_cm.__aenter__ = AsyncMock(return_value=_aiofiles_file)
+_aiofiles_open_cm.__aexit__ = AsyncMock(return_value=False)
+_aiofiles_mock.open = MagicMock(return_value=_aiofiles_open_cm)
+sys.modules["aiofiles"] = _aiofiles_mock
+
+sys.modules["yaml"].safe_load = MagicMock(return_value={})
+sys.modules["yaml"].dump = MagicMock(return_value="")
+
+# Add the backend package to sys.path so relative imports resolve
+_backend_dir = Path(__file__).parent.parent
+sys.path.insert(0, str(_backend_dir.parent))
+
+
+# ---------------------------------------------------------------------------
+# Import the modules under test *after* stubs are in place.
+# ---------------------------------------------------------------------------
+
+import importlib as _il
+
+# Force a clean import so the module-level singleton starts as None.
+if "backend.routers" in sys.modules:
+    del sys.modules["backend.routers"]
+if "backend.service" in sys.modules:
+    del sys.modules["backend.service"]
+if "backend.views" in sys.modules:
+    del sys.modules["backend.views"]
+
+from backend import routers as _routers_mod  # noqa: E402
+from backend.routers import get_service  # noqa: E402
+from backend.service import WorkflowService  # noqa: E402
+from backend.views import TaskInfo  # noqa: E402
+
+
+# ---------------------------------------------------------------------------
+# Helper: reset the module-level singleton between tests.
+# ---------------------------------------------------------------------------
+
+def _reset_singleton():
+    _routers_mod._service_instance = None
+
+
+# ===========================================================================
+# Test Suite 1 — get_service() singleton
+# ===========================================================================
+
+class TestGetServiceSingleton(unittest.TestCase):
+    """get_service() must return the same WorkflowService instance on every call."""
+
+    def setUp(self):
+        _reset_singleton()
+
+    def tearDown(self):
+        _reset_singleton()
+
+    def test_returns_workflow_service_instance(self):
+        svc = get_service()
+        self.assertIsInstance(svc, WorkflowService)
+
+    def test_same_instance_on_repeated_calls(self):
+        """Every call within a request cycle must return the exact same object."""
+        svc1 = get_service()
+        svc2 = get_service()
+        self.assertIs(svc1, svc2, "get_service() must return a singleton, not a new instance")
+
+    def test_task_state_survives_across_calls(self):
+        """Task state written via one call must be readable via a subsequent call."""
+        svc = get_service()
+        svc.active_tasks["task-abc"] = TaskInfo(status="running", workflow="demo.workflow.json")
+
+        # Simulate a second HTTP request hitting get_service()
+        svc2 = get_service()
+        self.assertIn("task-abc", svc2.active_tasks)
+        self.assertEqual(svc2.active_tasks["task-abc"].status, "running")
+
+    def test_singleton_reset_creates_new_instance(self):
+        svc1 = get_service()
+        _reset_singleton()
+        svc2 = get_service()
+        self.assertIsNot(svc1, svc2)
+
+
+# ===========================================================================
+# Test Suite 2 — load failure marks task as 'failed'
+# ===========================================================================
+
+class TestWorkflowLoadFailureStatus(unittest.IsolatedAsyncioTestCase):
+    """When Workflow.load_from_file raises, active_tasks[task_id].status must be 'failed'."""
+
+    def _make_service(self):
+        svc = WorkflowService.__new__(WorkflowService)
+        svc.tmp_dir = Path("/tmp/fake_wf_dir")
+        svc.log_dir = Path("/tmp/fake_wf_dir/logs")
+        svc.active_tasks = {}
+        svc.workflow_tasks = {}
+        svc.cancel_events = {}
+        svc.llm_instance = MagicMock()
+        svc.browser_instance = MagicMock()
+        svc.controller_instance = MagicMock()
+        return svc
+
+    async def test_load_failure_sets_status_to_failed(self):
+        svc = self._make_service()
+
+        from backend.views import WorkflowExecuteRequest
+
+        request = WorkflowExecuteRequest(name="bad.workflow.json", inputs={})
+        task_id = "test-task-001"
+        cancel_event = asyncio.Event()
+
+        # Patch Workflow.load_from_file to raise
+        load_error = FileNotFoundError("workflow schema invalid")
+        sys.modules["workflow_use.workflow.service"].Workflow.load_from_file = MagicMock(
+            side_effect=load_error
+        )
+
+        # Patch _write_log so we don't touch the filesystem
+        svc._write_log = AsyncMock()
+
+        # Patch Path.exists to return True (so the workflow_path check passes)
+        with patch.object(Path, "exists", return_value=True):
+            await svc.run_workflow_in_background(task_id, request, cancel_event)
+
+        task_info = svc.active_tasks.get(task_id)
+        self.assertIsNotNone(task_info, "active_tasks entry must exist after run")
+        self.assertEqual(
+            task_info.status,
+            "failed",
+            f"Expected status 'failed' after load error, got '{task_info.status}'",
+        )
+        self.assertIsNotNone(task_info.error, "error field must be populated")
+        self.assertIn("workflow schema invalid", task_info.error)
+
+    async def test_load_failure_logs_error(self):
+        """The load error must be written to the log, not silently dropped."""
+        svc = self._make_service()
+
+        from backend.views import WorkflowExecuteRequest
+
+        request = WorkflowExecuteRequest(name="bad.workflow.json", inputs={})
+        task_id = "test-task-002"
+        cancel_event = asyncio.Event()
+
+        sys.modules["workflow_use.workflow.service"].Workflow.load_from_file = MagicMock(
+            side_effect=ValueError("corrupt yaml")
+        )
+
+        log_calls = []
+
+        async def capture_log(path, msg):
+            log_calls.append(msg)
+
+        svc._write_log = capture_log
+
+        with patch.object(Path, "exists", return_value=True):
+            await svc.run_workflow_in_background(task_id, request, cancel_event)
+
+        error_logged = any("corrupt yaml" in msg for msg in log_calls)
+        self.assertTrue(error_logged, "Load error must appear in the log output")
+
+
+if __name__ == "__main__":
+    unittest.main()