KI für Klinische Bewertung und Biologische Sicherheit – Chancen und Grenzen

„In 5 Jahren schreibt kein Mensch mehr regulatorische Dokumente. Das macht dann die KI.“ Solche Aussagen begegnen mir regelmäßig – in Social Media, bei Netzwerktreffen oder im Gespräch mit Kund*innen. Die Faszination für KI-Tools ist verständlich. Ich bin selbst Fachinformatikerin und habe an Digitalisierungsprojekten mitgearbeitet. KI-Assistenten erleichtern auch mir als Beraterin das Leben.

Trotzdem rate ich deutlich davon ab, die Klinische Bewertung oder die Bewertung der Biologischen Sicherheit an einen KI-Assistenten auszulagern – auch perspektivisch. Der Hauptgrund: Es handelt sich um sicherheitskritische Prozesse mit direkten Auswirkungen auf Patient*innen.

In diesem Artikel zeige ich, wo KI heute schon Zeit spart und wo sie an Grenzen stößt. Ohne Hype, ohne Schwarzmalerei – einfach ein ehrlicher Blick auf den sinnvollen Einsatz.


Warum KI nicht die gesamte Bewertung übernehmen kann

Sicherheitskritische Prozesse erfordern menschliche Expertise

Klinische Bewertungen und die Bewertung der Biologischen Sicherheit sind keine administrativen Routineaufgaben. Sie sind sicherheitskritische Prozesse, die direkt über die Sicherheit von Patient*innen entscheiden. Ein Fehler in der Risiko-Nutzen-Abwägung kann schwerwiegende Folgen haben.

KI-Tools arbeiten auf Basis von Mustern und Trainingsdaten. Sie können keine Verantwortung übernehmen. Bei der MDR-Konformität geht es aber genau darum: Jemand muss für die Bewertung geradestehen. Diese Verantwortung liegt bei qualifizierten Fachleuten und nicht bei einem Algorithmus.

Die ISO 14971 verlangt eine systematische Risikobewertung. Dazu gehört Kontextwissen über das spezifische Medizinprodukt, den klinischen Einsatz und die Zielgruppe. Dieses Verständnis kann eine KI nicht entwickeln. Sie kann unterstützen, aber nicht eigenständig bewerten.

Sensible Produktdaten gehören nicht in KI-Chatbots

Ein weiterer kritischer Punkt: Vertraulichkeit. Die Technische Dokumentation enthält wettbewerbsrelevante Informationen, Konstruktionsdetails und proprietäre Daten. Diese Informationen in einen öffentlichen Chatbot wie ChatGPT einzugeben, ist fahrlässig.

Selbst bei lokalen oder unternehmenseigenen KI-Lösungen bleibt das Risiko. Daten können in Trainingsdatensätze einfließen, Logs werden gespeichert, und es gibt keine absolute Garantie für Datensicherheit. In der Medizintechnik arbeiten wir mit hochsensiblen Informationen. Hier gilt: Vorsicht vor Schnelligkeit. Außerdem sehe ich derzeit noch keinen breiten Einsatz von lokalen AIs auf Herstellerseite, den gerade für kleine und mittlere Unternehmen sind die Hürden für die Implementierung nicht zu vernachlässigen.

Ich arbeite täglich mit vertraulichen Produktdaten. Keine dieser Informationen landet bei mir in einem KI-Tool. Das ist keine Technologiefeindlichkeit, sondern professionelle Sorgfalt.


Wo KI-Tools heute schon Zeit sparen – die sinnvollen Einsatzgebiete

Literaturrecherche und Strukturierung

Trotz aller Einschränkungen: KI kann wertvolle Dienste leisten. Besonders bei vorbereitenden Tätigkeiten spart sie Zeit.

Für unerfahrene Kolleg*innen kann eine KI beim Einstieg in die Literaturrecherche helfen. Sie schlägt Suchbegriffe vor, strukturiert Ergebnisse und gibt einen Überblick über relevante Publikationen. Das ersetzt keine fundierte Recherche-Expertise, kann aber den Einstieg erleichtern. (Hand aufs Herz: Für Rechercheexpert*innen dürfte die Zeitersparnis hier kaum relevant sein.)

Beim State of the Art hilft KI bei der Strukturierung und der Textgenerierung. Sie kann große Mengen wissenschaftlicher Texte durchforsten und thematisch clustern. Das spart Zeit bei der Vorsortierung. Die finale Bewertung, ob eine Publikation wirklich relevant ist, bleibt aber menschliche Aufgabe.

Auch das Zusammenfassen von Publikationen geht schneller. Eine KI kann Abstracts extrahieren, Kernaussagen herausfiltern und erste Übersichtstabellen erstellen. Die initiale Literaturbewertung – ist eine Studie methodisch robust? – kann eine KI anstoßen. Die endgültige Einschätzung muss aber durch Fachpersonal erfolgen.

Administrative und formale Aufgaben

Bei administrativen Aufgaben spielt KI ihre Stärken aus. Abkürzungsverzeichnisse erstellen, Rechtschreibung und Grammatik prüfen, Formatierungen vereinheitlichen. Das sind Tätigkeiten, bei denen Automatisierung Sinn ergibt.

KI kann Übersichtstabellen aus unstrukturierten Texten generieren. Sie kann Referenzen formatieren und Querverweise prüfen. Das sind Routineaufgaben, die Zeit kosten, aber keinen inhaltlichen Mehrwert bringen.

Hier eine Übersicht, wo KI-Einsatz heute schon sinnvoll ist:

AufgabeKI-EignungBegründung
Literaturrecherche (Einstieg)MittelHilft bei Suchbegriffen, aber braucht Fach-Validierung
Publikationen zusammenfassenHochSchnelle Extraktion von Kernaussagen
Übersichtstabellen erstellenHochStrukturierung aus Rohdaten
AbkürzungsverzeichnisseHochReine Formataufgabe
Rechtschreibung/GrammatikHochStandard-Software-Funktion
State of the Art strukturieren und textenMittelVorsortierung möglich, Bewertung bleibt menschlich
Initiale LiteraturbewertungNiedrigErste Filter möglich, finale Bewertung kritisch

Klinische Bewertung – wo der Mensch unverzichtbar bleibt

Klinisch relevante Parameter ableiten

Eine Klinische Bewertung beginnt damit, die richtigen Fragen zu stellen. Welche Sicherheits- und Leistungsparameter sind für dieses spezifische Produkt relevant?

Eine KI kann generische Listen liefern. Sie kann aus der Literatur ableiten, welche Parameter bei ähnlichen Produkten geprüft wurden. Aber sie kann nicht verstehen, warum ein bestimmter Parameter bei Ihrem Produkt kritischer ist als bei einem anderen.

Ein Beispiel: Zwei Implantate aus demselben Material, aber unterschiedlichen Einsatzorten. Die klinisch relevanten Parameter unterscheiden sich fundamental. Eine KI würde beide ähnlich behandeln. Ein Mensch erkennt die Unterschiede und passt die Bewertung an.

Diese kontextuelle Intelligenz ist entscheidend. Sie macht den Unterschied zwischen einem generischen Bericht und einer präzisen, produktspezifischen Bewertung. Natürlich können Sie der KI entsprechenden Kontext mitgeben und ausgefeilte Prompts mit hunderten von Zeilen generieren. Aber: Sparen Sie dann wirklich noch Zeit? Oder verbringen Sie sie nur anders?

Bewertungsstrategie auswählen

Äquivalenznachweis oder klinische Prüfung? Diese Entscheidung hängt von regulatorischen Anforderungen, Produkteigenschaften und vorhandenen Daten ab. Eine KI kann die Optionen darstellen. Sie kann nicht entscheiden, welcher Weg für Ihr Produkt der richtige ist.

Die MDR stellt klare Anforderungen an die Bewertungsstrategie. Diese zu interpretieren und auf ein konkretes Produkt anzuwenden, erfordert regulatorische Expertise. Eine KI kann Richtlinien zitieren. Sie kann nicht bewerten, ob eine Strategie MDR-konform ist.

Ich erlebe immer wieder, dass Unternehmen versuchen, mit generischen Vorlagen zu arbeiten. Das Ergebnis: Bewertungen, die formal korrekt aussehen, aber inhaltlich nicht belastbar sind. Genau das würde eine KI produzieren – nur schneller.

Risiko-Nutzen-Abwägung durchführen

Die Risiko-Nutzen-Abwägung ist das Herzstück jeder Klinischen Bewertung. Sie verlangt eine komplexe Bewertungslogik. Risiken müssen gegen den Nutzen abgewogen, Grenzfälle bewertet und Unsicherheiten eingeordnet werden.

Die ISO 14971 gibt einen Rahmen vor. Aber sie sagt nicht, wie man einen konkreten Fall bewertet. Ist ein seltenes, aber schwerwiegendes Risiko vertretbar, wenn der Nutzen hoch ist? Wie gewichtet man verschiedene Risikoarten?

Diese Fragen haben keine algorithmischen Antworten. Sie erfordern Fachwissen, Erfahrung und manchmal auch Gespräche mit klinischen Partner*innen. Eine KI kann Daten präsentieren. Sie kann nicht bewerten.


Biologische Sicherheit – komplexe Bewertungen brauchen Fachexpertise

Gap-Analysen und Prüfstrategien entwickeln

Der Biologische Evaluationsplan (BEP) ist die Grundlage jeder Bewertung der Biologischen Sicherheit. Er definiert, welche Prüfungen nach ISO 10993-1 erforderlich sind.

Eine Gap-Analyse zeigt, welche Daten bereits vorliegen und welche noch fehlen. Das klingt simpel. Aber es erfordert präzises Verständnis der Norm, des Produkts und des Kontaktes mit dem Körper.

Eine KI kann eine Checkliste abarbeiten. Sie kann nicht erkennen, ob eine bestehende Prüfung ausreichend ist oder ob zusätzliche Tests nötig sind. Sie kann nicht beurteilen, ob ein Test unter vergleichbaren Bedingungen durchgeführt wurde.

Die Prüfstrategie legt fest, mit welchen Parametern das Labor die Prüfungen durchführt. Auch hier: Eine KI kann Standards zitieren. Sie kann nicht entscheiden, welche spezifischen Parameter für Ihr Material und Ihren Anwendungsfall kritisch sind.

Prüfergebnisse interpretieren und bewerten

Laborberichte zu prüfen, ist eine Kernaufgabe. Wurden die Tests nach den richtigen Normen durchgeführt? Sind die Ergebnisse plausibel? Gibt es Auffälligkeiten?

Eine KI kann einen Bericht auf formale Vollständigkeit prüfen. Sie kann nicht beurteilen, ob ein Testergebnis im Grenzbereich bedenklich ist. Sie kann nicht einordnen, ob eine Abweichung vom Protokoll kritisch ist.

Bei toxikologischen Recherchen gibt es spezialisierte Datenbanken. Diese sind nützlich bis unverzichtbar – aber sie sind keine KI-Chatbots. Die toxikologische Risikobewertung selbst bleibt eine fachliche Aufgabe. Sie erfordert Verständnis von Stoffwechselprozessen, Dosierungen und Expositionspfaden.

Auch hier gilt: Tools können unterstützen. Bewerten muss der Mensch.


Die realistische Zukunft: KI als intelligentes Werkzeug

Was sich in den nächsten Jahren ändern wird

KI wird besser werden. Spezialisierte Tools für die Medizintechnik werden kommen. Die Unterstützung bei Vorarbeiten wird sich verbessern. Literaturrecherchen werden schneller, Formatierungen automatischer und wir werden Schritte weg von rein dokumentbasierten Bewertungen hin zu umfänglichen Datenmodellen gehen.

Ich erwarte, dass KI sich nahtloser in bestehende Workflows integriert. Nicht als Ersatz für Fachpersonal, sondern als Effizienz-Tool. Ein intelligenter Assistent, der Routineaufgaben übernimmt und Zeit für die wichtigen Entscheidungen schafft.

Das ist eine positive Entwicklung. Sie entlastet Regulatory Affairs von zeitraubenden Tätigkeiten. Sie schafft Raum für das, was wirklich zählt: fundierte Bewertungen und gut begründete Entscheidungen.

Was auch in 5 Jahren menschliche Expertise bleiben wird

Trotz aller Fortschritte: Komplexe Bewertungen und Interpretationen bleiben menschlich. Die Verantwortung für eine Klinische Bewertung kann nicht delegiert werden. Eine Unterschrift unter einem CER oder der Toxikologischen Risikobewertung bedeutet: „Ich stehe für diese Bewertung ein.“

Regulatorische Entscheidungen erfordern Kontextwissen, Erfahrung und manchmal auch Mut. Sie erfordern die Fähigkeit, Grauzonen zu navigieren und vertretbare Kompromisse zu finden. Das kann keine KI leisten.

Auch in 5 Jahren werden Menschen Risiko-Nutzen-Abwägungen treffen. Auch in 5 Jahren werden Menschen entscheiden, welche Prüfstrategie angemessen ist. Die Werkzeuge werden besser. Die Verantwortung bleibt.


Fazit: KI sinnvoll einsetzen – ohne naive Technikgläubigkeit

KI ist ein mächtiges Werkzeug. Sie kann Literaturrecherchen beschleunigen, Routineaufgaben automatisieren und Daten strukturieren. Sie kann nicht entscheiden, bewerten oder Verantwortung übernehmen.

In der Klinischen Bewertung und der Bewertung der Biologischen Sicherheit geht es um Sicherheit. Nicht um Geschwindigkeit. Nicht um Kostenreduktion. Um Sicherheit.

Mein Rat: Nutzen Sie KI dort, wo sie Zeit spart – bei Vorarbeiten, bei administrativen Aufgaben, bei der Strukturierung. Aber verlassen Sie sich nicht darauf, dass sie Ihnen die Denkarbeit abnimmt. Das kann sie nicht. Das sollte sie auch nicht.

Sicherheit geht vor Automatisierung. Immer.

Sie brauchen Unterstützung?

Ob partnerschaftliches Sparring oder komplette Bewertung – mit machbaren Ansätzen bin ich an Ihrer Seite.

Portrait Tanja Domke
Hallo, ich bin Tanja Domke.

Als Fachexpertin unterstütze ich Medizinproduktehersteller in den Bereichen Klinische Bewertung und Biologische Sicherheit.

Newsletter

In meinem Newsletter teile ich Erfahrungsberichte, Praxistipps für Ihre Bewertungen, Neuigkeiten aus dem Regularien- und Normen-Dschungel und vieles mehr.

Beitrag suchen

Kategorien

Portrait Tanja Domke

Hallo, ich bin Tanja Domke.

Als Expertin für die Bereiche Klinische Bewertung und Biologische Sicherheit unterstütze ich Medizinproduktehersteller mit pragmatischen Bewertungsansätzen. 

Blogartikel durchsuchen

Leitfaden

Die 5 häufigsten Fehler bei der Bewertung der Biologischen Sicherheit - und wie Sie sie vermeiden

  • Die 5 häufigsten Fehler, die zu Verzögerungen und Zusatzkosten führen
  • Konkrete Praxisbeispiele aus echten Projekten (anonymisiert)
  • Was Sie stattdessen tun sollten, damit Ihre Bewertung konform wird