NTT DATA Business Solutions
Danny Groothuis | 28 lipca, 2020

Machine Learning dla branży farmaceutycznej | Część 2

Zabezpiecz swój system zarządzania infrastrukturą informatyczną przed tym, co przyniesie przyszłość dzięki eksperckim poradom dotyczącym trendów w informatyce zdefiniowanym przez NTT DATA.

Wdrożenie rozwiązania Machine Learning. Przykład zastosowania predykcyjnego monitorowania wody.

W poprzednim wpisie na naszym blogu przedstawiliśmy pakiet informacji, niezbędnych do zrozumienia najpopularniejszych zagadnień związanych ze Sztuczną Inteligencją. Uzbrojeni w tę wiedzę, w tym wpisie przejdziemy do bardziej praktycznych aspektów zastosowania Machine Learning w branży farmaceutycznej. Znajomość teorii to zawsze dobry pomysł, jednak realne przykłady zaczerpnięte z rzeczywistości pozwalają lepiej wyobrazić sobie działanie omawianych rozwiązań.

Jak stwierdziliśmy w poprzednim blogu, zorientowana na jakość natura przemysłu farmaceutycznego sprawia, że to potencjalnie cenna dziedzina do odkrywania nowych sposobów zastosowania Machine Learning. Zwłaszcza obszary biznesowe, które są zależne od procedur pobierania próbek, mogą natychmiast dostarczyć wyników. Kiedy dane wyjściowe są już dostępne, następnym logicznym krokiem jest zbadanie, czy potencjalne zmienne wejściowe są bezpośrednio dostępne. Jeśli są one dostępne lub ich gromadzenie może rozpocząć się w krótkim czasie, pojawia się potencjalna szansa, którą warto zbadać. Badanie to powinno być przeprowadzone ostrożnie i gruntownie, na przykład za pomocą proof of concept.

Dokładnie taką metodę wykorzystaliśmy w przypadku jednego z naszych klientów. Zidentyfikowaliśmy możliwość zastosowania Sztucznej Inteligencji i wykorzystaliśmy metodologię proof of concept do określenia potencjalnej wartości. W tej części bloga pokażemy proces, jak krok po kroku opracowaliśmy rozwiązanie do predykcyjnego zarządzania jakością wodą: Predictive Water Monitoring. Aby móc w pełni zrozumieć, w jaki sposób doszliśmy do tego pomysłu, konieczne jest zgłębienie podstawowych pojęć związanych z farmaceutycznymi procesami wykorzystującymi wodę oraz zrozumienie, jak wygląda proces pobierania próbek. Następnie wyjaśnimy, jak zrodził się pomysł na proof of concept oraz jak połączyliśmy punkty (czy zmienne), które skłoniły nas do opracowania rozwiązania do monitoringu wody. Na końcu wyjaśnimy, w jaki sposób przekształciliśmy nasze spostrzeżenia w proof of concept z uwzględnieniem różnych komponentów, w którym modele statystyczne są wykorzystywane w ramach rozwiązania, mogącego przynieść korzyści firmom farmaceutycznym w zarządzaniu strategią monitorowania wody.

 

Status Quo w monitoringu wody

Oczywiście, jakość wody ma zasadnicze znaczenie w środowisku farmaceutycznym, ponieważ funkcjonuje jako składnik wielu produktów, a także środek potrzebny przy procesach czyszczenia i sterylizacji. Z tego powodu wymogi prawne zmuszają firmy do kontrolowania jakości wody. Monitoring wody, jak nazywamy ten proces, wymaga udowodnienia, że wymogi jakościowe zostały spełnione.

Grafika 1: Przykład obiegu wody w połączeniu z manualnym pobieraniem próbek (Kliknij, aby dowiedzieć się więcej)

Do dnia dzisiejszego najbardziej powszechną techniką monitorowania wody jest ręczne pobieranie próbek. Na podstawie harmonogramu, opartego o konkretne przedziały czasowe, z wszystkich punktów (Points of Use), dostarczających wodę klasy farmaceutycznej, próbki pobiera się ręcznie bezpośrednio z butelek. Pod koniec procesu, próbki przekazywane są do działu jakości, który laboratoryjnie potwierdza ich parametry. Gdy wynik analizy próbki wykaże, że jakość wody nie była zgodna z wymaganiami, przeprowadza się kolejne badania, aby określić wpływ wody na jakość produktu końcowego. Rezultatem może być na przykład zlecenie dodatkowego badania danej partii produkcyjnej i/lub ustalenie przyczyn naruszenia wymaganych parametrów jakości wody.

Niestety, proces ten ma sporo wad. Podsumowując, możemy stwierdzić, że: ręczne pobieranie próbek jest uciążliwe ze względu na ilość czasu potrzebną na ich pobranie i analizę, jest podatne na błędy ze względu na mnogość działań, wykonywanych manualnie, jest nieoptymalne, ponieważ próbki prezentują jedynie wycinek sytuacji, zamiast zapewnić pełen wgląd w rzeczywiste wahania parametryczne w czasie.

Grafika 2: Graficzny przykład pomiaru zawartości węgla – Total Organic Carbon. Wykresy te ilustrują różnicę pomiędzy okresowym pobieraniem próbek (po lewej) prowadzącym do fragmentarycznego wykresu, zawierającego tylko „migawki” jakości wody, a stałym monitoringiem (po prawej). Jak widać, procedura okresowego pobierania próbek nie wychwytuje wahań pomiędzy momentami poboru próbek.

 

Farmaceutyczny cykl obiegu wody

Farmaceutyczne systemy wodne ustawiane są w tzw. cyklach wodnych. Ze względu na kosztowny charakter produkcji wody nadającej się do użycia w procesach farmaceutycznych, niewykorzystana woda w cyklu jest redystrybuowana do zbiornika magazynowego, dzięki czemu może być ponownie wykorzystana, (jeśli nadal spełnia podstawowe wymagania jakościowe), zamiast odprowadzana bezpośrednio do kanalizacji. W ramach cyklu, istnieje wiele punktów wykorzystania i punktów poboru próbek, mogą to być albo punkty kranowe używane w pomieszczeniach czystych (np. do czyszczenia sprzętu laboratoryjnego), albo bezpośrednie połączenia z (krytycznymi) maszynami produkcyjnymi, takimi jak bioreaktory, separatory i linie napełniające dla wstępnie wypełnionych strzykawek.

Wszystkie punkty użycia i punkty poboru próbek wymagają codziennego próbkowania i analiz, jak również zapisywania ich wyników w dedykowanej bazie danych. Umożliwia to analizę trendów, która może pomóc w odkryciu powtarzających się, okresowych wahań niektórych parametrów, mających wpływ na jakość wody. Ostatecznie, nieprzestrzeganie przepisów, prowadzące do wykorzystania w procesie produkcyjnym wody o niskiej jakości, może prowadzić do odrzucenia gotowego produktu.

W celu zminimalizowania tego ryzyka, wdraża się rozwiązania zabezpieczające, które stale monitorują cykl. Do takich rozwiązań należą m.in. czujniki temperatury aktywujące wymienniki ciepła, aby utrzymać cykl obiegu wody w odpowiedniej temperaturze, czy przepływomierze sterujące pompami, dzięki czemu woda pozostaje w obiegu.

 

Połącz kropki (lub bazy danych)

W przypadku tworzenia naszego rozwiązania, Eureka nadeszła w momencie, gdy jeden z naszych klientów zwrócił się do nas z prośbą o pomoc w udoskonaleniu istniejącej strategii monitorowania wody w swojej firmie. Klient skarżył się na nieoptymalny i kosztowny aspekt ręcznego procesu pobierania próbek i zastanawiał się, czy postęp technologiczny może przynieść jakiekolwiek rozwiązanie. Był to punkt wyjścia dla naszych dalszych badań.

Uzbrojeni w wiedzę na temat GMP, obowiązujących przepisów i możliwości technologicznych, zaczęliśmy badać dostępne źródła, zawierające dane dotyczące cyklu obiegu wody. Jako punkt wyjścia przyjęliśmy bazę danych zawierającą wyniki laboratoryjne, a dla niektórych cykli mieliśmy nawet możliwość bezpośredniego wglądu w krytyczne parametry wody, takie jak zawartość węgla organicznego, tzw. Total Organic Carbon.

Ponieważ cykl obiegu wody monitoruje wiele czujników zabezpieczających, byliśmy w stanie wyodrębnić z nich zarejestrowane dane i oznaczyć je jako niezależne zmienne, które należy przetestować, by sprawdzić, czy wygenerowanie modelu statystycznego z możliwością przewidywania jest możliwe. Typowymi niezależnymi zmiennymi, które byliśmy w stanie wyodrębnić z tych urządzeń zabezpieczających były: temperatura, ciśnienie, przepływ i przewodność. W połączeniu z wynikami próby, byliśmy w stanie stworzyć kompletny zestaw zmiennych. Aby ustalić istnienie potencjalnych związków pomiędzy którymikolwiek z odkrytych zmiennych, musieliśmy skorzystać z wiedzy ekspertów.

Z pomocą analityka laboratoryjnego dowiedzieliśmy się, że większość czynników, które prowadzą do pogorszenia jakości wody, może być wychwycona w przebiegu łańcucha przyczynowo-skutkowego. Każda czynność wykonywana w cyklu obiegu wody, taka jak pobieranie próbek czy prace konserwacyjne, może powodować zmianę jakości wody. Inne przykłady ilustrujące istnienie tej zależności to np. sytuacja, gdy temperatura wody spada lub dochodzi do zatrzymania jej przepływu. W pierwszym scenariuszu może dojść do rozwoju bakterii, takich jak legionella i różnych endotoksyn, a w drugim do rozwoju np. glonów lub pleśni.

Grafika 3: Wszystkie zmienne, które zostały wykorzystane do określenia zależności. Zidentyfikowane zależności mogą zostać przekształcone w modele statystyczne, które pozwalają na zapewnienie możliwości prognozowania jakości wody.

 

Potwierdzone zależności

W oparciu o zidentyfikowane zmienne i potwierdzone zależności, ważne jest aby wstępnie określić, czy możliwe jest ustalenie istotnych związków pomiędzy niezależnymi i zależnymi zmiennymi. Przy wsparciu eksperta, przygotowaliśmy dane i zastosowaliśmy różne techniki modelowania statystycznego.

Wyniki były obiecujące: techniki regresji ujawniły wiele zależności między zebranymi danymi z czujników, a informacjami o wynikach próby. Ponadto, poprzez dodanie z systemu ERP informacji związanych z konserwacją (czas, data, obiekt techniczny i rodzaj konserwacji zarejestrowany w zleceniach konserwacyjnych), mogliśmy potwierdzić wpływ działań konserwacyjnych. Ciekawym odkryciem była wysoka korelacja pomiędzy temperaturą i ciśnieniem w odniesieniu do ilości całkowitego węgla organicznego (TOC) w całym cyklu obiegu wody.

 

Proof of concept

Ponieważ związki pomiędzy niezależnymi i zależnymi od siebie zmiennymi zostały odwzorowane i zatwierdzone i ponieważ jesteśmy w stanie „przewidzieć” jakość wody, można było stworzyć rozwiązanie wykorzystujące Machine Learning. Finalnie, nasz projekt zawierał następujące elementy:

  1. Możliwość mapowania cykli monitorowania wody, w tym możliwość powiązania danych z czujników z różnymi elementami technicznymi tego cyklu, ze wskazaniem odpowiednich parametrów jakościowych i wstępnym określeniem zmiennych progów dla celów alarmowych. Ponadto, elementy, które zostały zmapowane w cyklu monitorowania wody powinny być zsynchronizowane z Laboratoryjnym Systemem Zarządzania Informacją (LIMS) w celu włączenia danych o wynikach próbek. Wzbogacenie danych o informacje z Centralnego Systemu Zarządzania Utrzymaniem Ruchu (CMMS) umożliwiłoby również włączenie informacji o zleceniach konserwacyjnych w celu sprawdzenia historii konserwacji w cyklu monitorowania wody.
  2. Lista z roboczym wykazem próbek, w celu poprawy dokładności próbkowania. Ponieważ niektóre punkty nadal wymagają ręcznego pobierania próbek, interfejs użytkownika powinien wspomagać próbkującego w prawidłowej rejestracji próbek. Nie tylko dokładniejszy znacznik czasu, ale również możliwość skanowania kodów QR na próbkowanych butelkach i punktach próbnych w celu ich połączenia powinna zmniejszyć margines błędu danych.
  3. Ostatni komponent – Machine Learning, łączy w sobie wszystkie informacje, w tym możliwość utrzymania podstawowych modeli statystycznych (np. edycja zmiennych lub ponowny trening). W tej części rozwiązania w oparciu o informacje o zmiennych niezależnych modele statystyczne pozwalają przewidzieć, kiedy zidentyfikowane zmienne zależne będą wychodziły poza swoje progi. Wszystko to składa się na nieskomplikowany przegląd graficzny pozwalający na sprawdzenie każdej ze zmiennych, ich zależności oraz generowanie alarmów na podstawie spodziewanych zmian w jakości wody.

Elementy te zostały opracowane w ramach naszego proof of concept. Koncentrując się tylko na pojedynczym cyklu obiegu wody w połączeniu z małym podzbiorem zmiennych, byliśmy w stanie szybko opracować portfolio rozwiązań i wykazać realną wartość dodaną dla naszego klienta. Co więcej, nigdy nie straciliśmy opcji potencjalnej skalowalności. Jak w każdym udanym proof of concept, modułowy charakter rozwiązania pozwala na szybkie zwiększenie skali i przekształcenie tej koncepcji w kompletny komponent IT, który może być wykorzystany w wielu procesach biznesowych.

 

Graficzna prezentacja Machine Learning w naszym proof of concept

Grafika 4: Graficzna prezentacja informacji z czujnika, mapowanych na żywo w cyklu obiegu wody. Mierniki zawierają również dane progowe, w celu wskazania, kiedy ważne parametry zostały naruszone. Wszystkie dane w cyklu są aktualizowane co 5 sekund o nowe informacje z czujników. (Kliknij, aby uzyskać więcej szczegółów)

 

Grafika 5: Podgląd partii produkcyjnych pozwala działom kontroli jakości na retrospektywną ocenę wody wykorzystywanej w produkcji seryjnej. Umożliwia on również generowanie dokumentacji raportu wsadowego zawierającego krytyczne parametry całej wody, która została użyta do produkcji konkretnej partii. Dzięki temu działy kontroli jakości mają bezpośredni wgląd i mogą udowodnić, że odpowiednie parametry były pod kontrolą. (Kliknij, aby uzyskać więcej szczegółów)

 

Grafika 6: Najważniejszy element naszego rozwiązania: predykcyjny dashboard. Wykresy po lewej stronie zawierają dane historyczne pewnej zmiennej zależnej, a środkowy i prawy zestaw wykresów przewiduje jakość wody. Środkowy rząd wykresów pozwala tworzyć prognozy na 1 godzinę do przodu, a prawy nawet na 3 godziny. Po prawej stronie ekranu znajdują się wszystkie wygenerowane alarmy dotyczące spodziewanej jakości wody. Pozwala to firmom przewidywać ewentualne przekroczenia dopuszczalnych parametrów (np. zadecydować o odroczeniu produkcji danej partii do czasu opanowania stopnia jakości wody). (Kliknij, aby uzyskać więcej szczegółów)

 

W kolejnym, ostatnim już blogu opowiemy o tym, jak możesz zacząć wdrożenie rozwiązań z zakresu Sztucznej Inteligencji w Twojej firmie. Omówimy konkretne elementy oraz wskażemy jak przejść od pomysłu, przez proof of concept, do kompletnego rozwiązania i usprawnić Twoje procesy.

Jeśli chcesz dowiedzieć się więcej o naszym rozwiązaniu do monitoringu cyklu obiegu wody (w tym o wykorzystanych komponentach informatycznych czy modelach statystycznych lub o kompletnym pakiecie rozwiązań do monitoringu wody), zapraszamy do kontaktu. Chętnie zaprezentujemy Ci możliwości, które oferuje nasze rozwiązanie oraz opowiemy więcej o jego działaniu.

 

Dowiedz się więcej o branży Life Science

 

Powiązane artykuły:

Machine Learning dla branży farmaceutycznej | Część 3

Machine Learning dla branży farmaceutycznej | Część 1

Cyfrowe trendy w branży Life Science