Forschungsdaten öffnen – Anreize, Repositorien und Kooperationen

Die Diskussion über die Nachprüfbarkeit und Nachnutzung von digitalen Forschungsdaten gewinnt an weiter an Dynamik. 2013 haben die Wissenschaftsministerien der G8-Staaten unter dem Stichwort “Open Scientific Research Data” einen möglichst offenen Zugang zu Forschungsdaten gefordert und damit eine zentrale Diskussion der Wissenschaft aufgegriffen, denn “Data Sharing” ist für die Bearbeitung vieler drängender Forschungsfragen unabdingbar.

Vermehrt fordern Förderorganisationen, wie z. B. die Europäische Kommission (u. a. im Rahmen des “Open Research Data Pilot“in Horizon 2020) und wissenschaftliche Zeitschriften, dass Daten – die Ergebnis eines geförderten Projekts oder Grundlage eines Artikels sind – offen zugänglich gemacht werden. Siehe hierzu z. B. ein aktuelles Editorial in Nature (doi:10.1038/515312a).

Forschende sehen zwar häufig das Potenzial offener Forschungsdaten, stehen der offenen Zugänglichkeit „ihrer“ Daten jedoch auch zurückhaltend gegenüber. Um eine Kultur des „Data Sharings“ zu fördern, ist es dringend nötig Anreize zu schaffen. Im kompetitiven Wissenschaftssystem gilt es, Wissenschaftlerinnen und Wissenschaftlern Daten-Repositorien anzubieten, auf denen Forschungsdaten dauerhaft zugänglich gemacht werden können. Von großer Bedeutung ist es dabei die Zitierfähigkeit der Forschungsdaten zu garantieren, um somit auch die Verankerung des Teilens im wissenschaftlichen Reputationssystems zu fördern.

Wissenschaftliche Institutionen und ihre Serviceeinrichtungen wie Bibliotheken, Daten- und Rechenzentren sind deshalb gefordert, Infrastrukturen und Services bereitzustellen, die die zitierfähige und  dauerhafte Zugänglichmachung der digitalen Forschungsdaten ermöglichen.

Am Deutschen GeoForschungsZentrum GFZ haben wir mit den Partnern KIT und HU in den letzten Jahren die Initiative re3data.org – Registry of Research Data Repositories gestartet (doi:10.1371/journal.pone.0078080). Anliegen war und ist es, Forschenden eine Orientierung über mögliche Orte zur Speicherung zur Zugänglichmachung ihrer Daten zu geben.

re3data.org – the Registry of Research Data Repositories Dank der Förderung der DFG und engagierter Projektpartner haben wir heute erfreulicherweise die „Tausender-Marke“ geknackt: re3data.org weist jetzt über 1.000 Daten-Repositorien aus der ganzen Welt nach. Ein einfaches Icon-System hilft bei der Einordnung der indexierten Daten-Infrastrukturen. (Weiterführende Informationen zum Stand von re3data.org finden sich im Projektblog.)

Das jüngste, in re3data.org indexierte Daten-Repositorium ging erst heute Nachmittag online. Es handelt sich um das „CERN Open Data Portal“. Über dieses Portal macht das CERN in Genf u. a. Daten aus den LHC-Kollaborationen für die Öffentlichkeit zugänglich. Die Forschungsdaten sind durch die Nutzung der Creative-Commons-Deed „CC0“ gemeinfrei nachnutzbar. Siehe dazu die Pressemitteilung der CERN-Kolleginnen und -Kollegen.

CERN Open Data Portal

Auch wenn die Anzahl der „Daten-Policies“ wächst und die Landschaft der Daten-Repositorien an Profil gewinnt, gibt es weiterhin viel zu tun. Um die komplexen Herausforderungen des „Data Sharings“ auf internationaler Ebene aufzugreifen formiert sich die „Research Data Alliance (RDA)“. Organisiert durch das Open Science Koordinationsbüro der Helmholtz-Gemeinschaft findet heute und morgen eine Tagung dieser Initiative am GFZ in Potsdam statt. Dort diskutieren 120 „Data Practitioners” aus verschiedensten Fachgebieten über Stand und Perspektive der deutschen Beteiligung in der Research Data Alliance.

Weitere Informationen zum Thema:

  • Zehn Anregungen zum Umgang mit Forschungsdaten finden sich im Kapitel „Publikation von Forschungsdaten“ (doi:10.2314/coscv1.53) im Handbuch “CoScience“ (Das Kapitel steht unter CC-BY und kann nachgenutzt, weiterbearbeitet – und damit gerne auch verbessert – werden.)
  • Weitere Informationen finden sich im Wiki forschungsdaten.org.
  • Darüber hinaus kann das Thema auch auf der Mailingliste “Umgang mit Forschungsdaten” diskutiert werden.

(Crosspost von wisspub.net.)

Posted in Forschungsdaten, Publizieren | 1 Comment

“Appell zur Nutzung offener Lizenzen in der Wissenschaft”

Die deutschen Wissenschaftsorganisationen haben heute einen “Appell zur Nutzung offener Lizenzen in der Wissenschaft” veröffentlicht (PDF). In diesem heißt es:

“Offene Lizenzen sind [...] ein elementarer Standard, der eine wissenschaftskonforme Nachnutzung wissenschaftlicher Produkte erleichtert. Mit der offenen Bereitstellung von Forschungsergebnissen werden deren Sichtbarkeit, Nachnutzbarkeit, schnelle Verbreitung und somit Innovation befördert. Offene Lizenzen erleichtern zudem die Umsetzung der Prinzipien guter wissenschaftlicher Praxis.

Die deutschen Wissenschaftsorganisationen halten [...] standardisierte offene Lizenzen für ein ideales Werkzeug, um im Sinne der Berliner Erklärung von 2003 die möglichst umfassende Nutzung wissenschaftlicher Inhalte rechtsverbindlich abzusichern.”

In dem Appell wird darüber hinaus auch die Empfehlung zur Nutzung von Creative-Commons-Lizenzen gegeben. Dabei werden für unterschiedliche Publikationstypen (z. B. Textpublikationen, wissenschaftliche Software, Metadaten) relevante Lizenzen erwähnt.

(Crosspost von wisspub.net)

Posted in Forschungsdaten, Open Access, Publizieren, Tipps und Tricks | Tagged | Leave a comment

Offenlegung von Open-Access-Publikationsgebühren in Deutschland

Die Geschäftsmodelle des Goldenen Weges des Open Access verlagern die Finanzierung: wissenschaftliche Einrichtungen und Fördererorganisationen (z. B. die DFG und die EU) stellen Mittel bereit, um Publikationen bereits bei der Veröffentlichung im Rahmen sogenannter Publikationsgebühren (auch Article-Processing Charges, APCs genannt) zu finanzieren. Dazu betreiben wissenschaftlichen Einrichtungen häufig sogenannte Open-Access-Publikationsfonds. Über diese wird der Umgang mit den Publikationsgebühren gemanagt. Zudem wird eine Vielzahl von Open-Access-Zeitschriften als Teil wissenschaftlicher Aktivitäten einzelner Organisationen herausgegeben und finanziert.

Eine Reihe von wissenschaftlichen Institutionen in Deutschland hat jetzt begonnen Angaben zur Höhe bezahlter Open-Access-Publikationsgebühren offenzulegen. Anliegen ist es, bezahlte “Open-Access-Publikationsgebühren der Hochschulen und außeruniversitären Forschungseinrichtungen in Deutschland umfassend zu dokumentieren” und damit einen Beitrag zu einer transparenten Entwicklung des goldenen Open-Access-Publizierens zu leisten.

Auf Initiative der Universität Bielefeld und unter Koordination der Arbeitsgruppe “Elektronisches Publizieren” der Deutschen Initiative für Netzwerkinformation (DINI) wurden die Daten von sieben wissenschaftlichen Einrichtungen auf GitHub , unter einer offenen Lizenz, zugänglich gemacht.

Folgende Visualisierung zeigt die Verteilung der bezahlten Open-Access-Publikationsgebühren auf die beteiligten Einrichtungen:

Verteilung: Open-Access-Publikationsgebühren pro Verlag

Der Datensatz umfasst aktuell 1.432 Open-Access-Artikel von sieben Institutionen im Umfang von 1.732.556 Euro. Wünschenswert ist, dass sich weitere Einrichtungen der Initiative anschließen.

Ähnliche Entwicklungen gibt es z. B. auch in Großbritannien. Eine Initative des Wellcome Trust im Frühjahr 2014 hat dort zu einer breiten Offenlegung der Zahlen geführt.

Die Gestaltung eines nachhaltigen Open-Access-Publikationssystems ist eine zentrale Herausforderungen für wissenschaftlichen Einrichtungen und ihre Bibliotheken. Im Rahmen der diesjährigen Open-Access-Week veröffentlichte die Arbeitsgruppe Open Access in der Schwerpunktinitiative “Digitale Information” der Wissenschaftsorganisationen eine Broschüre zum Thema “Open-Access-Publikationsfonds” (PDF). Ziel von Publikationsfonds ist es, den Transformationsprozess von subskriptionsbasiertem zu Publikationsgebühren-basiertem Open-Access-Publizieren effizient und nachhaltig zu gestalten. In der Broschüre wird erläutert, welchen Zielen Open-Access-Publikationsfonds dienen und was bei ihrem Aufbau und Betrieb beachtet werden sollte.

Anliegen der Wissenschaft ist es, den Transformationsprozess von Subskription zu Open Access aktiv zu gestalten und den sich formierenden Open-Access-Publikationsmarkt im Sinne der Wissenschaft zu realisieren. Die Wissenschaftsverlage haben den Wunsch nach Open Access längst erkannt. Jedoch ist nicht jedes Verlagsangebot wissenschaftsadäquat. Vor diesem Hintergrund wurden z. B. in der Helmholtz-Gemeinschaft Kriterien zum Umgang mit Open-Access-Publikationsgebühren erarbeitet. Z. B. sind sog. „hybride“ Modelle, bei der einzelne Beiträge in einer nicht-Open-Access-Zeitschrift durch den Publizierenden „freigekauft“ werden können, problematisch, da sich Verlage mit diesem Modell – zusätzlich zur Subskriptionsgebühr –  eine weitere Einnahmequelle sichern (sog. „double dipping“).

(Crosspost von wisspub.net)

Posted in Open Access, Publizieren | 1 Comment

ICSU: Open access to scientific data and literature and the assessment of research by metrics

Die Generalversammlung des International Council for Science (ICSU), der Dachorganisation einer Vielzahl wissenschaftlicher Vereinigungen, hat eine Erklärung verabschiedet, die sich klar zur Offenheit in der Wissenschaft bekennt:

“The scientific record should be:
- free of financial barriers for any researcher to contribute to;
- free of financial barriers for any user to access immediately on publication;
- made available without restriction on reuse for any purpose, subject to proper attribution;
- quality-­assured and published in a timely manner;
- archived and made available in perpetuity.”

Angesichts aktueller Herausforderungen werden darüber hinaus einige Empfehlungen gegeben. Zwei davon lauten:

– Datensupplemente zu Textpublikationen zitierbar machen
– offene Lizenzierung von Forschungsdaten, um die Nachnutzung zu erleichtern.

Open access to scientific data and literature and the assessment of research by metrics. International Council for Science, September 2014.

Posted in Forschungsdaten, Open Access, Publizieren, Verlagswesen, Zeitschriften | Leave a comment

Digitale Agenda 2014 – 2017. Den effektiven und dauerhaften Zugang zu öffentlich geförderten Forschungspublikationen und -daten verbessern und Anreize ausbauen

Die Digitale Agenda der Bundesregierung wurde am 20. August veröffentlicht und wird aktuell vielerorts besprochen.

Drei Zitate aus der Agenda sollen hier kurz hervorgehoben werden:


“Wir werden die Rahmenbedingungen für einen ungehinderten Informationsfluss, insbesondere in der Wissenschaft, verbessern. Dazu gehört eine umfassende Open-Access-Strategie, die den effektiven und dauerhaften Zugang zu öffentlich geförderten Forschungspublikationen und -daten verbessern und Anreize ausbauen soll.”

“Die Digitalisierung innovativer öffentlicher Dienstleistungen und Prozesse erleichtert und erfordert die weitere Öffnung staatlicher Geo-, Statistik-und anderer Datenbestände (Open Data). Mit Open Data fördern wir zugleich das Wachstum innovativer kleinerer und mittlerer Unternehmen. Wir machen die Bundesbehörden zu Vorreitern bei der Bereitstellung offener Daten in Deutschland. Dazu legen wir einen „Nationalen Aktionsplan zur Umsetzung der G8-Open-Data-Charta“ vor.
Fernerkundungsdaten wie z. B. Satellitenbilder sind von zunehmender Bedeutung für Wirtschaft, Wissenschaft und viele Bundesbehörden. Wir prüfen daher, wie ein zentraler digitaler Zugriff und daraus abgeleitete Produkte bereitgestellt werden können.”

“Durch Open Data, d. h. die maschinenlesbare Öffnung staatlicher Daten im Netz, werden wir für mehr Transparenz sorgen und neue digitale Dienste befördern.”

Posted in Forschungsdaten, Open Access | Leave a comment

Text- and Datamining – Kritik an Elseviers Politik

Text- und Datamining (TDM) spielt im wissenschaftlichen Arbeiten eine immer wichtigere Rolle und wird in Zukunft noch relevanter werden.

Unter dem Titel “Realising the innovative potential of digital research methods” wurde nun ein offener Brief an Elsevier veröffentlicht, der sich kritisch mit der zu Beginn des Jahres neu definierten Policy von Elsevier zu TDM auseinandersetzt.
Unter den Überschriften:
- Protect the academic freedom of the researcher
- Support responsible research and dissemination
- Prevent the creation of a monopoly
- Make technological prevention measures a last resort
- Deliver value for money
werden elementare Punkte für die Zukunft des Text- und Datamining benannt.

Lesenswert dazu ist das Papier des Helmholtz Open Science Koordinationsbüros: Rechtliche Aspekte von Text- und Datamining.

Posted in Forschungsdaten, Open Access, Publizieren, Verlagswesen, Zeitschriften | Leave a comment

Anzahl wissenschaftlicher Dokumente im Netz ermittelt

Die Menge an wissenschaftlichen Dokumenten im Netz ist in immense Dimensionen vorgestoßen und steigt kontinuierlich an. Das Web hat sich durch die Auswirkungen des elektronischen Publizierens zur Standard-Ressource für wissenschaftliches Arbeiten entwickelt und viele dieser Publikationen sind in frei zugänglichen akademischen Suchmaschinen wie Google Scholar und Microsoft Academic Search (MAS) auffindbar. Jedoch ist unklar, welcher Anteil an Dokumenten im Netz überhaupt existiert und wie viele davon erfasst sind. Die kommerzielle Datenbank Web of Science gibt beispielsweise an, etwa 50 Millionen qualitativ höherwertig erschlossene Dokumente zu verzeichnen. Im gleichen Bereich liegt nach eigenen Angaben die Suchmaschine Microsoft Academic Search. Für Google Scholar sowie für das gesamte Netz können die Angaben nur geschätzt werden, was ein Forscherteam aus den USA getan hat. Die Ergebnisse wurden im Mai 2014 in PLoS ONE veröffentlicht [1].

Figure 2. Relative number of documents by scholarly search engines and databases. doi:10.1371/journal.pone.0093949.g002

Für das gesamte Netz wurde demnach eine Anzahl von 114 Millionen (englischsprachige) wissenschaftlichen Dokumenten ermittelt, wovon etwa 27 Millionen (24%) frei verfügbar sind. Berücksichtigte Formen von wissenschaftlichen Dokumenten waren dabei Artikel aus Zeitschriften und Konferenzbänden, Dissertationen und Masterarbeiten, Bücher, technische Berichte und Working Papers. Patente sowie neuartige Publikationsformen wie Blogs oder Tweets wurden nicht inbegriffen. Nach Schätzung der Forscher verzeichnet Google Scholar 87% der im Netz vorhandenen wissenschaftlichen Dokumente, was einer Anzahl von ca. 100 Millionen Dokumenten entspricht.

Figure 3. The relative number of documents on the web for each of the 15 fields as defined by MAS. doi:10.1371/journal.pone.0093949.g003

Für den Bereich der Geowissenschaften wurde eine geschätzte Anzahl von ca. 3 Millionen Dokumenten ermittelt. Unter den einzelnen Wissenschaftsdisziplinen gibt es signifikante Unterschiede bei der Anzahl frei verfügbarer Dokumente. Die Quote liegt zwischen 12 und 50%, wobei die Geowissenschaften eine Quote von 35% erreichen.

Table 2. The percentage of publicly available scholarly documents found in Google Scholar. doi:10.1371/journal.pone.0093949.t002

[1] Khabsa M, Giles CL (2014): The Number of Scholarly Documents on the Public Web. PLoS ONE 9(5): e93949. doi:10.1371/journal.pone.0093949

Posted in Open Access, Publizieren, Zeitschriften | Leave a comment

Empfehlungen: (Metrics for) Career Paths in Multidisciplinary Research

Das Scientific Committee for Life, Environmental and Geo Sciences von Science Europe hat ein Opinion Paper veröffentlicht, das auf fehlende Metriken bei der Beurteilung von Wissenschaftlern in multidisziplinären Arbeitskontexten hinweist:

“[The Committee] wishes to alert academic employers, promotion and appointment Committees and European and national research funding organisations to the lack of clear evaluation metrics for scientists working in multidisciplinary teams. The absence of such metrics already has a negative impact on career paths, as many scientists hesitate to participate in multidisciplinary research.”

In den resultierenden Empfehlungen wird unter anderem auf die wichtige Rolle von Forschungsdaten und wissenschaftlicher Software explizit hingewiesen:


” … recommends that making data available to the scientific community at large through freely available data access models, repositories and webometrics, be considered as output equal in importance to scientific publications …”

“… recommends that the development of enabling tools such as methods, algorithms and software is recognised as a significant contribution to knowledge creation and management …”

Prof. W. Heinrich (GFZ) war unter den Autoren des Papiers.

Nachtrag: In der Ausgabe vom 17. Juli wird in Science Careers diese Empfehlung besprochen: Better Recognition for Multidisciplinary Research

Posted in Forschungsdaten, Publizieren, Tipps und Tricks | Leave a comment

Mehr Tore und dann Zitatweltmeister?

Metrics market

“Witness the announcement by analytics company Thomson Reuters, for instance, that it was kicking off its own World Cup — of research performance. In the first round, the firm announced that England could have reversed its disappointing loss against Italy had it been playing on the basis of research citation impact. By the same comparison, Australia would have defeated Chile — but the Netherlands would still have crushed Spain.”

Ein aktueller Artikel in Nature beschreibt treffend die neue Generation von Analysewerkzeugen der Anbieter Thomson-Reuters und Elsevier.
Noch schneller zu bedienen, noch stärker aggregiert, noch mehr vorgebliche Übersicht. Und stolze Preise: die Plattformen werden zusätzlich zu Science Citation Index und Scopus angeboten.

“With this next generation of commercial tools, it does not seem so fanciful to picture a senior manager somewhere in your research institution engaged in a kind of perpetual departmental World Cup, scrolling through screeds of bar charts and playing ‘fantasy faculty’ with the careers of researchers.”

Posted in Publizieren, Tipps und Tricks, Verlagswesen, Zeitschriften | Leave a comment

Fallstricke der “nicht kommerziell” Option in Creative Commons

Für viele Autoren scheint es selbstverständlich zu sein, dass sie ihre Werke für andere zugänglich und nachnutzbar machen wollen. Kommerzielle Verlage, mit ihren exorbitanten Gewinnmargen, sollen jedoch nicht Geld machen dürfen, wofür sie selber keinen Cent gezahlt haben. So scheint es naheliegend, Werke durch eine “nicht kommerziell” Bedingung einer kommerziellen Verwertung zu entziehen. Dabei treten jedoch für Autoren unerwartete Nebeneffekte auf [1].

Ein Grundlegendes Problem der Creative Commons Lizenzen mit Beschränkung auf “nicht kommerzielle” Nutzung ist, dass in den Lizenzbedingungen nur sehr unscharf formuliert wurde, was kommerzielle Nutzung ist. Diese Unschärfe verleitete das Landgericht Köln kürzlich zu der Interpretation, dass allein die private Nutzung “nicht kommerziell” ist; darüber berichtete der Blog des Instituts für Rechtsfragen der Freien und Open Source Software (IfROSS) [2]. Diese extrem enge Auslegung geht klar an der Intention der Lizenz vorbei, ist aktuell aber nun Stand der Diskussion. Ob das Urteil vom 5. März 2014 (Az.: 28 O 232/13) bestand hat, wird sich noch zeigen müssen.

Verweise:

[1] Klimpel, P. (2012), Folgen, Risiken und Nebenwirkungen der Bedingung “nicht-kommerziell – NC,” Wikimedia Deutschland, Berlin, Germany. http://irights.info/userfiles/CC-NC_Leitfaden_web.pdf
[2] Jäger, T. (2014), LG Köln beschränkt CC-BY-NC auf rein private Nutzungen, Institut für Rechtsfragen der Freien und Open Source Software. http://www.ifross.org/artikel/lg-k-ln-beschr-nkt-cc-nc-rein-private-nutzungen
Posted in Open Access, Publizieren | Tagged , , | Leave a comment