English Intern
IZKF Core Unit FDM

Speicherung und Berechnung

Der Kern unseres Forschungsdatenmanagement(FDM)-Angebotes ist ein engagiertes Team, das Beratung und Informationen zur effektiven Verwaltung von Forschungsdaten bietet. Zu den wichtigsten Säulen gehören Cloud-Lösungen für sichere und zugängliche Datenspeicherung und Zusammenarbeit, FDM- und Cloud-Softwareplattformen für die Datenanalyse und -freigabe, Hochleistungsrechnerumgebungen für komplexe Forschungsprojekte und Ressourcen zur Veröffentlichung und Archivierung von Forschungsdaten für eine langfristige Zugänglichkeit. Diese Komponenten sollen Forschungsbemühungen unterstützen und verbessern, indem sie eine umfassende Palette an Tools und Ressourcen für Zusammenarbeit, Datensicherheit und Rechenleistung bereitstellen.

Cloud-Lösungen

  • bwSync&Share: Ursprünglich am Karlsruhe Institut für Technologie (KIT) entwickelt, ist bwSync&Share eine Cloud-Speicherlösung, die auf die Zusammenarbeit in Wissenschaft und Forschung zugeschnitten ist. Es wird vom Rechenzentrum Würzburg (RZ) bereitgestellt und bietet sichere Speicherung und einfache Datenverwaltung.

  • Europäische Open Science Cloud (EOSC) ist eine großangelegte Initiative, die darauf abzielt, Europa einen gemeinsamen Rahmen für die Verwaltung und den Austausch von Forschungsdaten über Grenzen und Disziplinen hinweg zu bieten. Es bietet eine breite Palette von Diensten und Ressourcen zur Unterstützung offener Wissenschaft.

  • Individuelle Lösungen wie die TR240- und DECIDE-Cloud: Hierbei handelt es sich um spezialisierte Cloud-Lösungen, die von bestimmten Forschungskonsortien oder Projekten wie TR240 und DECIDE entwickelt und auf die Bedürfnisse und Anforderungen ihrer jeweiligen Forschungsgemeinschaft zugeschnitten sind. Sie bieten häufig einzigartige Funktionen und Integrationen zur Unterstützung spezifischer Forschungsabläufe.

  • Bavarian Cloud ist als Cloud-Computing-Infrastruktur geplant, die vom Land Bayern in Deutschland bereitgestellt werden soll. Es wird Speicher- und Rechenressourcen für Forschungs- und Innovationsprojekte bereitstellen und so die Zusammenarbeit und den Datenaustausch zwischen Forschern in der Region unterstützen.

Cloud- und FDM-Software

  • VRE Charité - Virtual Research Environment (GDPR-konform) ist eine virtuelle Forschungsumgebung, die für die Charité - Universitätsmedizin Berlin entwickelt wurde und GDPR entspricht. Es stellt Tools und Dienste für die gemeinsame Forschung bereit und gewährleistet gleichzeitig Datenschutz und Sicherheit, insbesondere für den Umgang mit sensiblen Patientendaten.

  • Aruna Cloud - anspruchsvolles Metadatenmanagement nach FAIR ist eine Cloud-basierte Plattform, die sich auf anspruchsvolles Metadatenmanagement nach den FAIR-Prinzipien (Auffindbar, Zugänglich, Interoperabel und Wiederverwendbar) konzentriert. Es hilft Forschern, ihre Daten effektiv zu organisieren und zu annotieren, sodass sie besser auffindbar und nutzbar sind. Aruna Cloud ist der Kern der in Jena gehosteten VirJenDB, welche ein  Use Case der NFDI microbiota ist.

  • Neo4j AuraDB ist ein robuster, in der Cloud gehosteter Diagrammdatenbankdienst von Neo4j, der für seine Effizienz beim Speichern und Abfragen hochgradig vernetzter Daten bekannt ist. AuraDB ist auf Anwendungen wie soziale Netzwerke, Empfehlungsmaschinen und Netzwerkanalysen in der Forschung zugeschnitten und zeichnet sich durch leistungsstarke und vorteilhafte diagrammbasierte Datenverwaltung aus.

  • Nextcloud ist eine selbstgehostete Open-Source-Plattform zur Dateisynchronisierung und -freigabe mit ähnlichen Funktionen wie kommerzielle Cloud-Speicherlösungen. Der Vorteil sind die größere Kontrolle über Datenschutz und -Sicherheit. Es ist hochgradig anpass- und erweiterbar und eignet sich daher für die Zusammenarbeit in der Forschung.

  • OMERO - Imaging Research Environment ist eine Open-Source-Plattform für die FAIRe  Verwaltung und Analyse von Mikroskopie- und Bilddaten in der Forschung. Es bietet Tools zum Organisieren, Visualisieren und Teilen großer Bilddatenmengen und erleichtert so die gemeinsame Forschung in den Biowissenschaften. OMERO ist in die FDM-Pläne und -Systeme mehrerer Universitäten integriert, beispielsweise bei der WWU Münster. 

  • SODAR - Sequencing Research Environment ist eine Cloud-basierte Plattform, die speziell für die FAIRe Verwaltung und Analyse von Sequenzierungsdaten in der Forschung entwickelt wurde. Es bietet Tools zum Verarbeiten, Annotieren und Visualisieren von Sequenzierungsdaten. Es unterstützt dabei verschiedenen Arten von Sequenzierungsexperimenten und -Arbeitsabläufen und ermöglicht so die Integration von Multiomics-Daten. SODAR ist Teil des FDM der Charité in Berlin

Hochleistungsrechner

  • Julia Cluster RZ Wü: Der Julia-Cluster am RZ Würzburg ist eine Hochleistungsrechnerumgebung (HPC), die speziell für die Unterstützung von Forschungsprojekten mit der Programmiersprache Julia konfiguriert ist. Es bietet Zugriff auf skalierbare Rechenressourcen für rechenintensive Aufgaben.

  • de.NBI Cloud ist eine Cloud-Computing Infrastruktur, die vom Deutschen Netzwerk für Bioinformatik-Infrastruktur (de.NBI) bereitgestellt wird. Es bietet Computerressourcen und -dienste, die auf die Bedürfnisse der bioinformatischen Forschung zugeschnitten sind. Es unterstützt Aufgaben wie Sequenzanalysen, molekulare Modellierung und Datenintegration.

  • Europäische Open Science Cloud (EOSC): Zusätzlich zu ihrer Rolle bei der Datenspeicherung und -freigabe stellt die EOSC auch Hochleistungsrechenressourcen zur Unterstützung rechenintensiver Forschungsprojekte in ganz Europa bereit.

Veröffentlichung und Archivierung von Forschungsdaten

  • WueData Forschungsdatenrepositorium ist ein Forschungsdatenrepositorium der Universität Würzburg in Deutschland. Es ermöglicht Forschern, ihre Daten nach den FAIR-Prinzipien (Auffindbar, Zugänglich, Interoperabel und Wiederverwendbar) zu veröffentlichen und zu teilen, sodass eine langfristige Zugänglichkeit und Nutzbarkeit gewährleistet ist.

  • Der Archivserver für langfristige Datenspeicherung ist ein dedizierter Speicherinfrastruktur, die zur Archivierung von Forschungsdaten, die nicht aktiv in laufenden Forschungsprojekten genutzt werden, verwendet wird. Es stellt die langfristige Aufbewahrung wertvoller Daten für zukünftige Referenzen und Analysen sicher.

Wissenschaftsdaten-Repositorien

  • PDB: Die Protein-Datenbank (PDB) ist ein spezialisiertes Repositorium für 3D-Strukturdaten großer Biomoleküle wie Proteine und Nukleinsäuren. Es bietet Zugriff auf Atomkoordinaten und zugehörige experimentelle Daten und unterstützt die Forschung in der Strukturbiologie und der Arzneimittelentwicklung.

  • GEO: Der Gene Expression Omnibus (GEO) ist ein öffentliches Repositorium für Hochdurchsatz-Genexpressionsdaten und anderen Arten von Daten zur molekularen Quantität. Es dient als wertvolle Ressource für Forscher, die sich mit der Genregulation, der Entdeckung von Biomarkern und Krankheitsmechanismen befassen.

  • ProSite: ProSite bietet eine Datenbank mit Proteinfamilien, -Domänen und funktionellen Stellen und liefert wertvolle Informationen zum Verständnis der Proteinstruktur und -funktion. Es hilft Forschern konservierte Motive und Muster zu identifizieren, die mit bestimmten biologischen Funktionen oder Aktivitäten verbunden sind.

  • IDR: Das Image Data Repository (IDR) konzentriert sich auf Bilddaten, insbesondere Mikroskopiedaten, und dient als Ressource für die Speicherung, Integration und Analyse von Bildern in den Bereichen der wissenschaftlichen und biomedizinischen Forschung. Es unterstützt die gemeinsame Forschung und den Datenaustausch innerhalb der Bildgebungs-Gemeinschaft.

...

Veröffentlichung von Code

  • GitHub: GitHub ist eine weit verbreitete Plattform zum Hosten und Teilen von Code-Repositorien und unterstützt Versionskontrolle und Zusammenarbeit mit Git. Besonders beliebt ist es bei Open-Source-Projekten. Es wird aber auch für private und kommerzielle Entwicklung eingesetzt.

  • GitLab: GitLab ähnelt GitHub, bietet jedoch zusätzliche Funktionen wie integrierte CI/CD-Pipelines, Issue-Tracking und Wikiseiten und stellt so eine umfassende Plattform für Projektmanagement und Zusammenarbeit dar.

  • Bitbucket: Bitbucket ist ein von Atlassian bereitgestellter Git-Repositorium-Hosting-Dienst, der kleinen Teams kostenlose Konten mit unbegrenzten privaten Repositorien bietet. Es ist eine gute Option für Einzelpersonen und Organisationen, die privates oder kleines Code-Hosting benötigen.

  • SourceForge: SourceForge ist ein webbasierter Dienst, der zentralisiertes Hosting für Open-Source-Softwareprojekte bietet. Es bietet Funktionen wie Versionskontrolle, Fehlerverfolgung und Projektmanagement-Tools und unterstützt die kollaborative Entwicklung und den Vertrieb von Software.

Allgemeine Anwendung

  • Zenodo: Zenodo ist ein universelles Open-Access-Repositorium, das im Rahmen des europäischen openAIRE-Programms entwickelt wurde. Es ermöglicht Forschern alle Forschungsergebnisse, wie Datensätze, Software, Paper und Präsentationen, in jeder Größe, jedem Format und aus jeder Disziplin zu teilen und aufzubewahren.