Publications by the same author
plus in the repository
plus in Google Scholar

Bibliografische Daten exportieren
 

Domänenspezifische Evaluation und Optimierung von Datenstandards und Infrastrukturen

URN to cite this document: urn:nbn:de:bvb:703-opus4-14865

Title data

Schneider, Tobias:
Domänenspezifische Evaluation und Optimierung von Datenstandards und Infrastrukturen.
Bayreuth , 2014 . - 449 P.
( Doctoral thesis, 2013 , University of Bayreuth, Faculty of Mathematics, Physics and Computer Sciences)

[thumbnail of DissTS20131218.pdf]
Format: PDF
Name: DissTS20131218.pdf
Version: Published Version
Available under License Creative Commons BY 3.0: Attribution
Download (9MB)

Abstract

In den letzten Jahren und Jahrzehnten ist die Menge der Daten, die in wissenschaftlichen Projekten erhoben wird, exorbitant gestiegen. Mit diesem gestiegenen Datenaufkommen geht eine Zunahme der Anforderungen an die Datenspeicherung und den Datenaustausch einher. Dazu wurden in den letzten Jahrzehnten Infrastrukturen entwickelt, welche diese Aufgaben für eine bestimmte Domäne übernehmen. Insbesondere in der Domäne der Lebenswissenschaften sind sogenannte Megascience-Plattformen entstanden, welche für den globalen Datenaustausch verantwortlich sind. Ein wesentliches Merkmal dieser Infrastrukturen sind die unterstützten Datenstandards. Um die Eignung eines Datenstandards oder einer Infrastruktur in einer Domäne zu bestimmen, werden generische Evaluationssysteme benötigt. Auf Basis der Evaluation mit diesen Systemen ist es möglich, Schwachstellen in Infrastrukturen und Datenmodellen zu erkennen und diese Mängel zu beseitigen. Grundlage hierfür ist die Strukturierung der Anwendungsdomäne in Prozessen. In dieser Arbeit werden die Themenbereiche der Datenstandards und Infrastrukturen in der Anwendungsdomäne der Biodiversitätsinformatik getrennt untersucht. Im ersten Teil der Arbeit werden Datenstandards betrachtet. Ausgangspunkt sind die Datenstandards, da diese den Datenaustausch in einer Infrastruktur limitieren. Dazu wird ein generisches Evaluationssystem für Datenstandards entwickelt, domänenspezifisch angepasst und auf Standards der Biodiversitätsinformatik angewendet. Kern des Frameworks ist die Vollständigkeitsanalyse mit der 'Process Oriented Schema Evaluation' (POSE), welche die Basis des Frameworks bildet. Dabei konnte keiner der untersuchten Datenstandards die Anforderungen der Biodiversitätsinformatik vollständig erfüllen. Auf Basis dieser Erkenntnisse wurde mit der 'Process Oriented Data Schema Language' (PODSL) mit PODSL-Biodiv ein flexibles Datenmodell für die Datenspeicherung in der Biodiversität entwickelt. Der zweite Teil der Arbeit behandelt Infrastrukturen. Dazu wird zunächst mit dem 'Infrastructure Evaluation Framework' (IEF) ein Evaluationssystem für Infrastrukturen auf der Grundlage von Prozessen entwickelt und auf die wichtigsten Infrastrukturen in der Biodiversitätsinformatik angewendet. Dabei ist für die Qualität einer Infrastruktur neben der technischen Umsetzung auch deren Organisation dieser maßgeblich. Im Rahmen der Evaluation konnte ermittelt werden, dass die Infrastruktur der 'Global Biodiversity Information Facility' (GBIF) als wichtigste Infrastruktur der Biodiversitätsinformatik die Kriterien an die Funktionalität einer Infrastruktur nicht vollständig erfüllen kann. Mit BDEI wird ein Konzept zur Weiterentwicklung von GBIF vorgestellt, um diese Mängel zu beseitigen.

Abstract in another language

During the recent years and decades the amount of data collected in scientific projects has been growing dramatically. The demands on data persistence and infrastructures increased analogically. To cope with these challenges infrastructures for data exchange in specific domains have been built. Especially in the domain of life-sciences so called megascience platforms emerged which are responsible for the global data exchange. An essential attribute of these infrastructures are the supported data models and standards. To determine the appropriateness of a given data standard for a specific domain generic evaluation systems are needed. With the help of these evaluation systems weaknesses in existing standards and infrastructures can be identified and eliminated. The fundament of this evaluation is to structure the application domain into processes. In this thesis all areas of data standards and infrastructures will be analyzed separately behind the background of biodiversity and biodiversity informatics as application domains. The first part of this thesis covers data standards. The results in the areas of evaluation of data standards and infrastructures are generic and can be applied to other domains. As data standards are a fundamental part of an infrastructure, this subject will be discussed first. To accomplish this, a generic system for the evaluation of data standards is developed and applied on the most important data standards in the domain of biodiversity. Basis of this system is the analysis of completeness of a data standard with the 'Process Oriented Schema Evaluation' (POSE). It is shown that none of these data standards can fulfill the demands on a standard of the domain of biodiversity informatics completely. On basis of these findings PODSL-Biodiv is developed with the 'Process Oriented Data Schema Language' (PODSL) as a flexible data standard for the domain of Biodiversity informatics. The second part of this thesis is concerned with infrastructures. At first 'Infrastructure Evaluation Framework' (IEF) is developed as an evaluation system for infrastructures on the basis of processes and applied to important infrastructures in the domain of biodiversity informatics. It is shown, that the organization of an infrastructure has a large impact on the quality beside the pure technical capabilities. The 'Global Biodiversity Information Facility' (GBIF) network is identified as the most important infrastructure in the domain of biodiversity. Nonetheless even the GBIF network cannot fulfill the requirements on an infrastructure completely. To overcome these deficits, the concept of BDEI as a further development of GBIF is proposed.

Further data

Item Type: Doctoral thesis (No information)
Additional notes (visible to public): RVK: ST 690 Sonstige
Keywords: Schema <Informatik>; Datentransfer; Datenintegration; Web Services; Datenqualität; Evaluation von Datenschemata; Optimierung von Datenschemata; Evaluation von Infrastrukturen; Optimierung von Infrastrukturen; Standardisierung
DDC Subjects: 000 Computer Science, information, general works > 004 Computer science
Institutions of the University: Faculties > Faculty of Mathematics, Physics und Computer Science > Department of Computer Science
Faculties
Faculties > Faculty of Mathematics, Physics und Computer Science
Language: German
Originates at UBT: Yes
URN: urn:nbn:de:bvb:703-opus4-14865
Date Deposited: 24 Apr 2014 13:48
Last Modified: 24 Apr 2014 14:19
URI: https://epub.uni-bayreuth.de/id/eprint/82

Downloads

Downloads per month over past year