Anzahl wissenschaftlicher Dokumente im Netz ermittelt

Die Menge an wissenschaftlichen Dokumenten im Netz ist in immense Dimensionen vorgestoßen und steigt kontinuierlich an. Das Web hat sich durch die Auswirkungen des elektronischen Publizierens zur Standard-Ressource für wissenschaftliches Arbeiten entwickelt und viele dieser Publikationen sind in frei zugänglichen akademischen Suchmaschinen wie Google Scholar und Microsoft Academic Search (MAS) auffindbar. Jedoch ist unklar, welcher Anteil an Dokumenten im Netz überhaupt existiert und wie viele davon erfasst sind. Die kommerzielle Datenbank Web of Science gibt beispielsweise an, etwa 50 Millionen qualitativ höherwertig erschlossene Dokumente zu verzeichnen. Im gleichen Bereich liegt nach eigenen Angaben die Suchmaschine Microsoft Academic Search. Für Google Scholar sowie für das gesamte Netz können die Angaben nur geschätzt werden, was ein Forscherteam aus den USA getan hat. Die Ergebnisse wurden im Mai 2014 in PLoS ONE veröffentlicht [1].

Figure 2. Relative number of documents by scholarly search engines and databases. doi:10.1371/journal.pone.0093949.g002

Für das gesamte Netz wurde demnach eine Anzahl von 114 Millionen (englischsprachige) wissenschaftlichen Dokumenten ermittelt, wovon etwa 27 Millionen (24%) frei verfügbar sind. Berücksichtigte Formen von wissenschaftlichen Dokumenten waren dabei Artikel aus Zeitschriften und Konferenzbänden, Dissertationen und Masterarbeiten, Bücher, technische Berichte und Working Papers. Patente sowie neuartige Publikationsformen wie Blogs oder Tweets wurden nicht inbegriffen. Nach Schätzung der Forscher verzeichnet Google Scholar 87% der im Netz vorhandenen wissenschaftlichen Dokumente, was einer Anzahl von ca. 100 Millionen Dokumenten entspricht.

Figure 3. The relative number of documents on the web for each of the 15 fields as defined by MAS. doi:10.1371/journal.pone.0093949.g003

Für den Bereich der Geowissenschaften wurde eine geschätzte Anzahl von ca. 3 Millionen Dokumenten ermittelt. Unter den einzelnen Wissenschaftsdisziplinen gibt es signifikante Unterschiede bei der Anzahl frei verfügbarer Dokumente. Die Quote liegt zwischen 12 und 50%, wobei die Geowissenschaften eine Quote von 35% erreichen.

Table 2. The percentage of publicly available scholarly documents found in Google Scholar. doi:10.1371/journal.pone.0093949.t002

[1] Khabsa M, Giles CL (2014): The Number of Scholarly Documents on the Public Web. PLoS ONE 9(5): e93949. doi:10.1371/journal.pone.0093949

Posted in Open Access, Publizieren, Zeitschriften | Leave a comment

Empfehlungen: (Metrics for) Career Paths in Multidisciplinary Research

Das Scientific Committee for Life, Environmental and Geo Sciences von Science Europe hat ein Opinion Paper veröffentlicht, das auf fehlende Metriken bei der Beurteilung von Wissenschaftlern in multidisziplinären Arbeitskontexten hinweist:

“[The Committee] wishes to alert academic employers, promotion and appointment Committees and European and national research funding organisations to the lack of clear evaluation metrics for scientists working in multidisciplinary teams. The absence of such metrics already has a negative impact on career paths, as many scientists hesitate to participate in multidisciplinary research.”

In den resultierenden Empfehlungen wird unter anderem auf die wichtige Rolle von Forschungsdaten und wissenschaftlicher Software explizit hingewiesen:


” … recommends that making data available to the scientific community at large through freely available data access models, repositories and webometrics, be considered as output equal in importance to scientific publications …”

“… recommends that the development of enabling tools such as methods, algorithms and software is recognised as a significant contribution to knowledge creation and management …”

Prof. W. Heinrich (GFZ) war unter den Autoren des Papiers.

Posted in Forschungsdaten, Publizieren, Tipps und Tricks | Leave a comment

Mehr Tore und dann Zitatweltmeister?

Metrics market

“Witness the announcement by analytics company Thomson Reuters, for instance, that it was kicking off its own World Cup — of research performance. In the first round, the firm announced that England could have reversed its disappointing loss against Italy had it been playing on the basis of research citation impact. By the same comparison, Australia would have defeated Chile — but the Netherlands would still have crushed Spain.”

Ein aktueller Artikel in Nature beschreibt treffend die neue Generation von Analysewerkzeugen der Anbieter Thomson-Reuters und Elsevier.
Noch schneller zu bedienen, noch stärker aggregiert, noch mehr vorgebliche Übersicht. Und stolze Preise: die Plattformen werden zusätzlich zu Science Citation Index und Scopus angeboten.

“With this next generation of commercial tools, it does not seem so fanciful to picture a senior manager somewhere in your research institution engaged in a kind of perpetual departmental World Cup, scrolling through screeds of bar charts and playing ‘fantasy faculty’ with the careers of researchers.”

Posted in Publizieren, Tipps und Tricks, Verlagswesen, Zeitschriften | Leave a comment

Fallstricke der “nicht kommerziell” Option in Creative Commons

Für viele Autoren scheint es selbstverständlich zu sein, dass sie ihre Werke für andere zugänglich und nachnutzbar machen wollen. Kommerzielle Verlage, mit ihren exorbitanten Gewinnmargen, sollen jedoch nicht Geld machen dürfen, wofür sie selber keinen Cent gezahlt haben. So scheint es naheliegend, Werke durch eine “nicht kommerziell” Bedingung einer kommerziellen Verwertung zu entziehen. Dabei treten jedoch für Autoren unerwartete Nebeneffekte auf [1].

Ein Grundlegendes Problem der Creative Commons Lizenzen mit Beschränkung auf “nicht kommerzielle” Nutzung ist, dass in den Lizenzbedingungen nur sehr unscharf formuliert wurde, was kommerzielle Nutzung ist. Diese Unschärfe verleitete das Landgericht Köln kürzlich zu der Interpretation, dass allein die private Nutzung “nicht kommerziell” ist; darüber berichtete der Blog des Instituts für Rechtsfragen der Freien und Open Source Software (IfROSS) [2]. Diese extrem enge Auslegung geht klar an der Intention der Lizenz vorbei, ist aktuell aber nun Stand der Diskussion. Ob das Urteil vom 5. März 2014 (Az.: 28 O 232/13) bestand hat, wird sich noch zeigen müssen.

Verweise:

[1] Klimpel, P. (2012), Folgen, Risiken und Nebenwirkungen der Bedingung “nicht-kommerziell – NC,” Wikimedia Deutschland, Berlin, Germany. http://irights.info/userfiles/CC-NC_Leitfaden_web.pdf
[2] Jäger, T. (2014), LG Köln beschränkt CC-BY-NC auf rein private Nutzungen, Institut für Rechtsfragen der Freien und Open Source Software. http://www.ifross.org/artikel/lg-k-ln-beschr-nkt-cc-nc-rein-private-nutzungen
Posted in Open Access, Publizieren | Tagged , , | Leave a comment

AGU gibt ältere Jahrgänge frei (… aber nicht die vor 1997)

“The American Geophysical Union (AGU) and Wiley today announced that, starting 1 May, all AGU journal content from 1997 to content published 24 months ago will be made freely available. This change will apply to all articles and supplementary materials from journals that are not already open access, as well as AGU’s weekly newspaper, Eos. It currently represents more than 80,000 journal articles and issues of Eos. Additional content will continue to become open every month, on a 24-month rolling cycle.”

http://news.agu.org/press-release/valuable-earth-and-space-science-research-now-more-accessible-to-the-public/

Für den Zugang zum Archiv der Artikel die vor 1997 erschienen sind, muss allerdings immer noch bezahlt werden.

Für die aktuellen Jahrgänge, die nach wie vor nur nach Subskription zugänglich sind, bietet die AGU die Möglichkeit die Artikel ein halbes Jahr nach Erscheinen in unserer Publikationsdatenbank zweitzuveröffentlichen und damit offen zugänglich zu machen.
Anders als bei vielen anderen Verlagen ist hierbei sogar die Nutzung des Original-PDF erwünscht:

Permission to Deposit an Article in an Institutional Repository
AGU allows authors to deposit their journal articles if the version is the final published citable version of record, the AGU copyright statement is clearly visible on the posting, and the posting is made 6 months after official publication by the AGU.

Posted in Open Access, Publizieren, Verlagswesen, Zeitschriften | Leave a comment

Joint Declaration of Data Citation Principles

“Sound, reproducible scholarship rests upon a foundation of robust, accessible data. For this to be so in practice as well as theory, data must be accorded due importance in the practice of scholarship and in the enduring scholarly record. In other words, data should be considered legitimate, citable products of research. Data citation, like the citation of other evidence and sources, is good research practice and is part of the scholarly ecosystem supporting data reuse.”

Soeben erschienen, die ‘Joint Declaration for Data Citation Principles‘. Kurz und kompakt sind sind hier aktuelle Regeln zum Zitieren von Forschungsdaten zusammengestellt.

Interesse? Die Bibliothek hilft Ihnen weiter!

Posted in Forschungsdaten, Publizieren, Tipps und Tricks, Verlagswesen, Zeitschriften | Leave a comment

Data, lost in space

Datenmaterial, das einen Artikel ergänzt, wird oft direkt bei der Zeitschrift als Supplement abgelegt.
Nicht jeder Verlag behandelt solche Supplemente mit der gebotenen Sorgfalt.

Als Beispiel, ein Artikel aus 2006:

S U P P L E M E N T A R Y M AT E R I A L
A supplementary appendix is available for this article online. It includes … contain data used in the numerical experiment, respectively. Appendix … contains the (UNIX) patch file fixing …. This material is part of the online article available on http://www.blackwell-synergy.com.

Die Plattform Blackwell-Synergy existiert inzwischen nicht mehr, darüber hinaus hat die Zeitschrift den Verlag gewechselt. Das Supplement ist schlichtweg nicht mehr verfügbar.

Um solche Datensupplemente dauerhaft und nachweisbar zu publizieren, bietet die Bibliothek einen entsprechenden Service an.
Publikation von Supplementen wissenschaftlicher Daten zur Ergänzung einer Textpublikation

Ein Beispiel:
Swierczynski, T., Brauer, A., Lauterbach, S., Martin-Puertas, C., Dulski, P., von Grafenstein, U., Rohr, C. (2012): A 1600 yr seasonally resolved record of decadal-scale flood variability from the Austrian Pre-Alps. – Geology, 40, 11, 1047-1050, 10.1130/G33493.1.
Supplementary Data: 10.5880/GFZ.5.2.2012.001

Manche Verlage (hier das Beispiel Nature) fordern inzwischen:
“A condition of publication in a Nature journal is that authors are required to make materials, data and associated protocols promptly available to others without undue qualifications. Data sets must be made freely available to readers from the date of publication, and must be provided to editors and peer-reviewers at submission, for the purposes of evaluating the manuscript. For the following types of data set, submission to a community-endorsed, public repository is mandatory …”

Hierzu auch aktuell in Nature:
Scientists losing data at a rapid rate : decline can mean 80% of data are unavailable after 20 years. Nature. doi:10.1038/nature.2013.14416 oder http://arxiv.org/abs/1312.5670

Posted in Forschungsdaten, Open Access, Verlagswesen, Zeitschriften | Leave a comment

10 Jahre ‘Berliner Erklärung über den offenen Zugang zu wissenschaftlichem Wissen’

Zu den Erstunterzeichnern der ‘Berliner Erklärung über den offenen Zugang zu wissenschaftlichem Wissen‘ gehörten vor 10 Jahren alle deutschen Wissenschaftsorganisationen.
Inzwischen liest sich die Liste der Unterzeichner wie ein Who’s who der weltweiten Wissenschaftslandschaft.

Viel hat sich seither getan, die Erklärung ist aber in ihren Wortlaut längst nicht veraltet. Einige Auszüge:

“The Internet has fundamentally changed the practical and economic realities of distributing scientific knowledge and cultural heritage. For the first time ever, the Internet now offers the chance to constitute a global and interactive representation of human knowledge, including cultural heritage and the guarantee of worldwide access.”

“Our mission of disseminating knowledge is only half complete if the information is not made widely and readily available to society.”

“The author(s) and right holder(s) of such contributions grant(s) to all users a free, irrevocable, worldwide, right of access to, and a license to copy, use, distribute, transmit and display the work publicly and to make and distribute derivative works, in any digital medium for any responsible purpose, subject to proper attribution of authorship …”

“A complete version of the work and all supplemental materials,… in an appropriate standard electronic format is deposited (and thus published) in at least one online repository using suitable technical standards … that is supported and maintained by an academic institution, scholarly society, government agency, or other well-established organization that seeks to enable open access, unrestricted distribution, inter operability, and long-term archiving.”

Posted in Forschungsdaten, Open Access, Publizieren, Verlagswesen, Zeitschriften | Leave a comment

ALM – ein Beitrag zum informierten Blick auf Publikationen

Neben dem Blick auf etablierte Metriken wie der Zahl der Zitate, gezählt auf der Basis von Werkzeugen wie SCI und Scopus (mit all ihren Einschränkungen) werden seit Jahren die Möglichkeiten von “Altmetrics” untersucht.

Verschiedene Verlage, darunter auch Copernicus, setzen nun ein Programm namens ALM (Article level metrics) ein, um zu jedem Artikel automatisch relevante, weitere Zahlenwerte und deren Quellen anzugeben, die etwas über die Resonanz auf diesen Artikel aussagen können.

Im Einzelnen werden dabei zur Zeit erfaßt:
- Downloadstatistik des Verlags
- Zitate im Rahmen von CrossRef (dem weltweiten Verbund der Verlage zur Nutzung der DOI), Zitate aus Google Scholar
- Downloads des Artikels in Literaturverwaltungsprogrammen
- wissenschaftsrelevante soziale Medien

Was nützt das?
ALM kann dazu beitragen, die Wahrnehmung eines Artikels, die Resonanz auf einen Artikel sehr viel schneller und auf breiterer Basis zu erfassen. Klassische Zitate und ihre Messung sind zeitlich träge und basieren letztlich auf den Gepflogenheiten der papiergebundenen Zeitschriftenwelt.
ALM dagegen basiert auf den Möglichkeiten (z.B. Zugriffsstatistik) des elektronischen Publizierens und erfaßt Reaktionen sehr viel zeitnäher.

Man darf gespannt sein, wie schnell ALM bei der Mehrheit der Verlage zum Standard wird (es ist sicher kein Zufall, dass Open Access-Verlage hier vorangehen) und wie schnell Autoren diese zusätzliche Information zur Reichweite ihrer Publikation schätzen lernen.

Posted in Literaturverwaltung, Open Access, Publizieren, Verlagswesen, Zeitschriften | Leave a comment

Wiki forschungsdaten.org bündelt Kompetenzen zum Umgang mit Forschungsdaten

Im Rahmen der aktuell laufenden internationalen Aktionswoche Open Access Week 2013 geht das Wiki forschungsdaten.org online. Anliegen ist es, Forschenden und den Infrastruktureinrichtungen wie Datenzentren und Bibliotheken eine Plattform für den Informationsaustausch zu bieten.

Die Diskussion über den verantwortungsvollen und zeitgemäßen Umgang mit digitalen Daten, die in Forschungsprojekten entstehen, hat in den letzten Jahren deutlich an Dynamik gewonnen. Jüngst wurde im  G8 Science Ministers Statement die Relevanz des offenen Zugang zu Forschungsdaten betont. Um drängende Forschungsfragen zu beantworten steigt in vielen Fachgebieten die Nachfrage nach dem “data sharing”. Um Forschungsdaten wissenschaftsadäquat austauschen zu können sind vielfältige Herausforderungen zu meistern. Im Fokus steht die Etablierung einer nachhaltigen Forschungsdateninfrastruktur, die es Wissenschaftlerinnen und Wissenschaftlern erlaubt ihre Daten in vertrauenswürdigen Repositorien zu speichern. Darüber hinaus müssen Anreize für “Open Data” in der Wissenschaft geschaffen werden. Da die Aufbereitung von wissenschaftlichen Daten in eine für Dritte nachnutzbare Form im Laboralltag häufig zu kurz kommt, müssen neue Publikationspraktiken und Reputationsmechanismen entwickelt werden, die Forschenden Anerkennung für den Datenaustausch garantieren.

Initiatoren des Wikis sind verschiedene von der Deutschen Forschungsgemeinschaft (DFG) geförderte Projekte, die sich mit der Realisierung der Forschungsdateninfrastruktur befassen. Das Wiki soll im Rahmen des DFG-Projektes re3data.org in Kooperation mit der Deutschen Initiative für Netzwerkinformation e.V. (DINI) weiterentwickelt werden. Anliegen des Projektes re3data.org ist es, Speicherorte (sogenannte Repositorien) von Forschungsdaten zu verzeichnen und einzuordnen und damit den Zugang zu den dort gespeicherten Daten zu erleichtern.

Gehostet wird das Wiki vom Deutschen GeoForschungsZentrum GFZ, Helmholtz-Zentrum Potsdam. Alle Inhalte stehen unter einer offenen Lizenz und sind somit nachnutzbar. Mitarbeit am Wiki und Unterstützung bei der Weiterentwicklung sind willkommen. (Eine Anmeldung im Wiki ist nötig.)

Folgende Projekte sind an dem Aufbau des Wikis beteiligt:

Weitere Informationen:

Posted in Forschungsdaten | Tagged , | Leave a comment