changed a lot regarding rec state, etc.

2019-12-03 16:05:02 +01:00
parent a709dbcaef
commit 190f728eb7
13 changed files with 369 additions and 831 deletions
--- a/backend/cron/init.py
+++ b/backend/cron/init.py
@@ -1,76 +1,90 @@
+# -*- coding: utf-8 -*-
+
 import logging
-from multiprocessing.pool import ThreadPool
-from threading import Lock
-from typing import Union
+import random
+import signal
+import sys
+import time
+from logging.handlers import TimedRotatingFileHandler
+from pprint import pprint

-from backend import app, LrcException
-from backend.models import Recorder
-from backend.tools.simple_state_checker import check_capture_agent_state, ping_capture_agent
+from backend import app, main_logger

-cron_log_handler = logging.FileHandler(app.config.get('CRON_LOG_FILE'))
+from apscheduler.schedulers.background import BackgroundScheduler
+
+from backend.cron.cron_state_checker import recorder_checker
+
+cron_log_handler = TimedRotatingFileHandler(app.config.get('CRON_LOG_FILE'), interval=1, when='d', backupCount=3)
+cron_log_handler.setFormatter(logging.Formatter('[%(asctime)s] - %(funcName)20s() %(message)s'))
 cron_logger = logging.getLogger("mal.cron")
 cron_logger.addHandler(cron_log_handler)
 logging.getLogger("apscheduler.scheduler").addHandler(cron_log_handler)
 logging.getLogger("apscheduler.executors.default").addHandler(cron_log_handler)

-recorder_jobs_lock = Lock()
-recorder_jobs = set()
-
-NUM_THREADS = 8
+scheduler = None


-def add_recorder_to_state_check(recorder: Union[int, Recorder]):
-    if isinstance(recorder, int):
-        recorder = Recorder.get_by_identifier(recorder)
-    if recorder is None:
-        cron_logger.warning(
-            "Could not add recorder to state check, as specified id could not be found / recorder is None")
-        raise LrcException("Recorder is None / could not be found!")
-    recorder_jobs_lock.acquire()
-    recorder_jobs.add(recorder)
-    recorder_jobs_lock.release()
+def get_default_scheduler():
+    cron_logger.debug("creating scheduler!")
+    global scheduler
+    scheduler = BackgroundScheduler()
+    scheduler.daemonic = False
+
+    return scheduler


-def remove_recorder_from_state_check(recorder: Union[int, Recorder]):
-    if isinstance(recorder, int):
-        recorder = Recorder.get_by_identifier(recorder)
-    if recorder is None:
-        cron_logger.warning(
-            "Could not remove recorder from state check, as specified id could not be found / recorder is None")
-        raise LrcException("Recorder is None / could not be found (and therefor not removed)!")
-    recorder_jobs_lock.acquire()
-    recorder_jobs.remove(recorder)
-    recorder_jobs_lock.release()
+def add_default_jobs(sched=None, testing=False):
+    global scheduler
+    if sched is None:
+        sched = scheduler
+
+    if testing:
+        check_recorder_state_job = sched.add_job(recorder_checker.check_object_state, 'interval', seconds=40,
+                                                 id="check_recorder_state_job")
+
+    else:
+        check_recorder_state_job = sched.add_job(recorder_checker.check_object_state, 'interval', minutes=2,
+                                                 id="check_recorder_state_job")
+
+    return [check_recorder_state_job]


-def check_recorder_state():
-    recorder_jobs_lock.acquire()
-    recorders = list(recorder_jobs)
-    recorder_jobs_lock.release()
+def signal_handler(sig, frame):
+    print('You pressed Ctrl+C -> shutting down scheduler!')
+    if scheduler is not None:
+        scheduler.shutdown()
+    sys.exit(0)

-    recorder_states = {r['name']: {'state_ok': False, 'msg': 'unknown state!'} for r in recorders}

-    with ThreadPool(NUM_THREADS) as pool:
-        results = [pool.apply_async(check_capture_agent_state, (recorder,)) for recorder in recorders]
-        try:
-            state_results = [res.get(timeout=12) for res in results]
-        except TimeoutError as e:
-            cron_logger.error("Timeout while getting capture agent state! {}".format(e))
+if __name__ == '__main__':
+    # check_for_ingestibles_and_ingest()
+    # remove_obsolete_media_files_objects()
+    stream_handler = logging.StreamHandler()
+    stream_handler.setFormatter(
+        logging.Formatter('[%(asctime)s] {%(threadName)s} %(levelname)s in %(module)s, line %(lineno)d: %(message)s'))
+    cron_logger.addHandler(stream_handler)
+    cron_logger.setLevel(logging.INFO)

-        for r in state_results:
-            if r[0]:  # ok :)
-                recorder_states[r[2]] = {'state_ok': True}
-            else:
-                recorder_states[r[2]]['msg'] = r[1]
+    signal.signal(signal.SIGINT, signal_handler)
+    get_default_scheduler()
+    add_default_jobs(testing=True)
+    cron_logger.info("Starting internal scheduler")
+    scheduler.start()

-    with ThreadPool(NUM_THREADS) as pool:
-        results = [pool.apply_async(ping_capture_agent, (recorder,)) for recorder in recorders]
-        try:
-            ping_results = [res.get(timeout=12) for res in results]
-        except TimeoutError as e:
-            cron_logger.error("Timeout while pinging capture agent! {}".format(e))
+    c = 0
+    while c < 10:
+        sleep_time = random.randint(10, 20)
+        cron_logger.info("Sleeping for {}s".format(sleep_time))
+        time.sleep(sleep_time)
+        recorder_id = random.randint(0, 15)
+        cron_logger.info("Using recorder id {}".format(recorder_id))
+        recorder_checker.add_object_to_state_check(recorder_id)
+        recorder_checker.add_object_to_state_check(recorder_id+1)
+        pprint(recorder_checker.get_current_state())

-        for r in ping_results:
-            if not r[0]:  # ok :)
-                recorder_states[r[2]]['msg'] = r[1]
+    while True:
+        user_in = input("Type >exit< to quit.")
+        if user_in == "exit" or user_in == ">exit<":
+            break

+    scheduler.shutdown()
--- a/backend/cron/cron_state_checker.py
+++ b/backend/cron/cron_state_checker.py
@@ -0,0 +1,136 @@
+# -*- coding: utf-8 -*-
+import datetime
+import logging
+from multiprocessing.context import TimeoutError
+from multiprocessing.pool import ThreadPool
+from threading import Lock
+from typing import Union, Callable, TypeVar, Generic, Set, List
+
+from backend.models import Recorder
+from backend.tools.simple_state_checker import check_capture_agent_state, ping_capture_agent
+
+logger = logging.getLogger("mal.cron.recorder_state")
+
+recorder_jobs_lock = Lock()
+recorder_jobs = set()
+
+NUM_THREADS = 8
+
+T = TypeVar('T')
+
+
+class StateChecker(Generic[T]):
+    def __init__(self, state_checker_func: Union[Callable, List[Callable]], type_to_check: T, type_name=None,
+                 threads=NUM_THREADS):
+        self.num_threads = threads
+        self.lock = Lock()
+        self.jobs: Set[T] = set()
+        self.checker_func = state_checker_func
+        self.checker_type = type_to_check
+        self.update_state_lock = Lock()
+        self.state_results = {}
+        self.type_name = type_name if type_name is not None else self.checker_type.__name__
+
+    def add_object_to_state_check(self, object_to_check: Union[int, T]):
+        if isinstance(object_to_check, int):
+            if not hasattr(self.checker_type, 'get_by_identifier'):
+                logger.error(
+                    'Can\'t add object to state check, as >get_by_identifier< not defined on checker_type ({})!'.format(
+                        str(self.checker_type)))
+                return
+            object_to_check = self.checker_type.get_by_identifier(object_to_check)
+        if object_to_check is None:
+            logger.warning(
+                "Could not add object ({}) to state check, as specified >id ({})<  could not be found / object is None".format(
+                    self.type_name, object_to_check))
+            return
+        self.lock.acquire()
+        if hasattr(object_to_check, 'name'):
+            name = object_to_check.name
+        else:
+            name = str(object_to_check)
+        logger.debug("Adding {} to object ({}) to state check".format(self.type_name, name))
+        self.jobs.add(object_to_check)
+        self.lock.release()
+
+    def remove_recorder_from_state_check(self, object_to_check: Union[int, T]):
+        if isinstance(object_to_check, int):
+            object_to_check = self.checker_type.get_by_identifier(object_to_check)
+        if object_to_check is None:
+            logger.warning(
+                "Could not remove object ({}) from state check, as specified id could not be found / object is None".format(
+                    self.type_name))
+            return
+        self.lock.acquire()
+        if hasattr(object_to_check, 'name'):
+            name = object_to_check.name
+        else:
+            name = str(object_to_check)
+        logger.debug("Removing {} from object ({}) to state check".format(self.type_name, name))
+        self.jobs.remove(object_to_check)
+        self.lock.release()
+
+    def execute_checker_func(self, func, jobs: List[T], object_states: dict) -> dict:
+        with ThreadPool(self.num_threads) as pool:
+            results = [pool.apply_async(func, (job,)) for job in jobs]
+            try:
+                state_results = [res.get(timeout=12) for res in results]
+                for r in state_results:
+                    if r[0]:  # ok :)
+                        if object_states[r[2]].get('msg', "") == "unknown state!":
+                            del object_states[r[2]]['msg']
+                        object_states[r[2]] = {
+                            'msg': ", ".join([s for s in [object_states[r[2]].get('msg', None), r[1]] if s]),
+                            'state_ok': True}
+                    else:
+                        object_states[r[2]]['msg'] = r[1]
+            except TimeoutError as e:
+                logger.error("Timeout while performing state check func! {}".format(e))
+
+        return object_states
+
+    def check_object_state(self) -> dict:
+        logger.info("checking object ({}) state...".format(self.type_name))
+        self.lock.acquire()
+        jobs = list(self.jobs)
+        self.lock.release()
+
+        if len(jobs) <= 0:
+            logger.info("No objects ({}) to check... returning".format(self.type_name))
+            return {}
+        logger.info("checking state of {} recorders".format(len(jobs)))
+
+        object_states = {j.name: {'state_ok': False, 'msg': 'unknown state!'} for j in jobs}
+
+        if isinstance(self.checker_func, list):
+            for c_f in self.checker_func:
+                self.execute_checker_func(c_f, jobs, object_states)
+        else:
+            self.execute_checker_func(self.checker_func, jobs, object_states)
+
+        self.update_state_dict(object_states)
+
+        return object_states
+
+    def update_state_dict(self, object_states: dict):
+        self.update_state_lock.acquire()
+        for o_s in object_states.keys():
+            if o_s in self.state_results:
+                # update existing state
+                self.state_results[o_s] = {**object_states[o_s],
+                    'time_stamp': datetime.datetime.now(datetime.timezone.utc).strftime(
+                        "%d.%m.%Y - %H:%M:%S %Z"),
+                    'previous': {'state_ok': self.state_results[o_s]['state_ok'],
+                                 'msg': self.state_results[o_s].get('msg', None),
+                                 'time_stamp': self.state_results[o_s].get('time_stamp', None)}}
+                pass
+            else:
+                self.state_results[o_s] = object_states[o_s]
+
+        self.update_state_lock.release()
+
+    def get_current_state(self):
+        return self.check_object_state()
+
+
+recorder_checker = StateChecker([check_capture_agent_state, ping_capture_agent], Recorder)