Heidelberg, 2. Juni 2020 — SAS, einer der weltweit führenden Anbieter von Lösungen für Analytics und künstliche Intelligenz (KI), bringt die Forschung rund um COVID-19 einen wichtigen Schritt weiter: COVID-19 Scientific Literature Search and Text Analysis, eine kostenfreie öffentliche Umgebung für visuelle Textanalyse, nutzt KI und Machine Learning, um Tausende von Forschungsberichten zu durchsuchen – und liefert Wissenschaftlern so viel schneller als bisher Antworten für ihre potenziell lebensrettende Arbeit.
Führende Forschungsgruppen haben bisher mehr als 50.000 wissenschaftliche Artikel zu den Forschungsergebnissen rund um COVID-19 und andere Coronaviren über das COVID-19 Open Research Dataset (CORD-19) gesammelt und veröffentlicht. Die Artikel umfassen Studien zur Wirksamkeit von Behandlungen, Impfstoffentwicklung, Strategien zur Eindämmung, Genanalysen und wirtschaftliche Auswirkungen. Angesichts des Umfangs ist eine manuelle Auswertung der wissenschaftlichen Literatur kaum möglich – oder zumindest nicht effizient.
COVID-19 Scientific Literature Search and Text Analysis ermöglicht auf der Basis von KI, Natural Language Processing, Linguistikregeln und moderner Modellierungstechniken eine schnelle und intelligente Extraktion relevanter Textstellen und numerischer Daten aus CORD-19. Die Umgebung vernetzt die globale Forschergemeinde über ein sich selbst steuerndes, cloudbasiertes System.
„Ein systematisches Durchforsten unstrukturierter Wissenschaftstexte kann große Teams über lange Zeit beschäftigen und sehr viel Fachwissen erfordern, wenn man die wirklich relevanten Informationen finden und in Beziehung setzen will“, sagt Mark R. Cullen, MD, Professor der Medizin an der Stanford University und Vorsitzender des COVID-19 Research Database Scientific Steering Committee. „SAS stellt jetzt eine Lösung bereit, die genau diesen Prozess beschleunigt. Forscher weltweit sind damit in der Lage, ihre Untersuchungen zu COVID-19 zu stützen – wenn es beispielsweise darum geht, Behandlungserfolge oder genetische Variablen in COVID-Mutationen zu beurteilen.“
Mit der neuen Visual-Text-Analytics-Umgebung können Anwender Forschungsergebnisse zu Corona-Themen interaktiv durchsuchen und sich zum Beispiel einen Überblick zu Inkubationszeiten, genetischen Abweichungen und Risikoerhebungen verschaffen. Sie haben darüber hinaus die Option, Daten zusammenfassend zu visualisieren. Mit Netzwerkanalyse können sie Übereinstimmungen in den Quellen und die Aussagekraft von Veröffentlichungen beurteilen.
Die interaktive Umgebung stellt über SAS Viya Advanced-Analytics- und KI-Methoden bereit, mit denen Wissenschaftler den CORD-19-Datensatz nach für sie relevanten Informationen durchsuchen können. Mit SAS Visual Text Analytics und SAS Visual Data Mining and Machine Learning bringt SAS Modelle ein, die von Linguisten sowie Gesundheits- und Life-Science-Experten entwickelt wurden. Die Modelle werten neben Textinformationen auch quantitative Daten aus, unter anderem in Bezug auf Inkubationszeiten und Reproduktionszahlen für COVID-19.
„Die Forschung zu COVID-19 läuft auf Hochtouren, daher kann die schnelle Versorgung der Wissenschaftler mit der relevanten und aktuellen Literatur eine echte Herausforderung sein“, erklärt Sajung Yun, PhD, Adjunct Faculty der Johns Hopkins University und CEO von ZtoMed. „SAS nutzt innovative KI-Techniken, um intelligent durch die Daten zu gehen. Anwender finden so intuitiv und rasch die entscheidenden Informationen.“
„SAS sucht immer wieder innovative Anwendungen für moderne Technologien, um Kunden branchenübergreifend im Umgang mit der Pandemie zu unterstützen“, erläutert Bryan Harris, Senior Vice President of Engineering bei SAS. „Die aktuelle KI-Umgebung geht über andere Lösungen hinaus, da sie eine einfach zu bedienende Oberfläche bietet, mit der sich komplexe Zusammenhänge in der Forschung aufdecken lassen. Ausschlaggebend ist, dass nicht nur Machine Learning, sondern auch der Mensch eine Rolle spielen. Anwender können unterschiedliche Aspekte der Daten anschauen, um genau diejenigen zu finden, die sie am besten in ihrer Arbeit unterstützen.“
COVID-19 Epidemiological Scenario Analysis ist eine interaktive Umgebung auf Basis von Modellen für Medical Resource Optimization, die zusammen mit der Cleveland Clinic entwickelt wurden. Die Modelle sagen unterschiedliche Szenarien zur Virusentwicklung voraus, beispielsweise, wo Krankheitsfälle ausbrechen könnten oder wie wirksam die Maßnahmen der Gesundheitsbehörden sind.
Verschiedene Komponenten für die Corona-Forschung stellt SAS der Wissenschaftscommunity auf dem dedizierten COVID-19 Data Analytics Resources Hub zur Verfügung. Dazu gehören kostenfeie analytische Modelle, ein frei zugängliches Dashboard zur Ausbreitung der Pandemie, eine Data-Discovery-Umgebung auf SAS Viya und Trainingsprogramme.
circa 4.900 Zeichen