Workshop-Bericht: Integration von großen Datenbeständen

Vor einem Jahr fand in Washington (D.C.) ein Workshop des US National Research Council statt um herauszufinden, welche Hürden der Integration großer Datenbestände in den Naturwissenschaften entgegen stehen und mit welchen Werkzeugen und Maßnahmen diesen Hindernissen begegnet werden könnte. Inzwischen ist der Workshop-Bericht bei National Academy Press erschienen und kann von deren Webseiten kostenlos als PDF-Dokument bezogen werden.

For the purposes of the workshop, “large-scale data integration” was taken to refer to the aggregation of data sets that are so large that searching or moving them is nontrivial, a technical challenge that is becoming ever more common as it becomes easy to produce and store terabytes. Workshop participants were also aware that a growing number of opportunities require the aggregation of large numbers of modest-size datasets, and some of the workshop discussion reflects the challenges associated with those situations.

In der Diskussion wurde klar zwischen “data discovery” und “data exploitation” unterschieden, da diese beiden Felder sehr verschiedene Problemstellungen aufweisen. In den Geowissenschaften spielt dabei auch die Integration verschiedener mäßig großer Datenbestände, wie sie im obigen Zitat erwähnt werden, eine wichtige Rolle. In diesem Fall sind “discovery” und “exploitation” stark auf einander angewiesen.

Data integration must overcome the challenge of finding disparate, distributed sources of data, which is often referred to as “data discovery,” and the challenge of effectively utilizing the collective information in those sources to produce new insight—a process known as “data exploitation.”

Deutlich wurde in der Diskussion die Notwendigkeit von Daten Repositorien, um Forschungsdaten für weitere Nutzung vorzuhalten und findbar zu machen.

Weidman, S., und T. Arrison (2010), Steps Toward Large-Scale Data Integration in the Sciences: Summary of a Workshop, The National Academies Press, Washington, D.C. [online]  http://www.nap.edu/catalog.php?record_id=12916

This entry was posted in Forschungsdaten and tagged . Bookmark the permalink.

Leave a Reply