ZENODO:CERNの作ったなんでもリポジトリ

https://zenodo.org/

メモ。以前から存在は知っていたものの、ZENODO = OpenAIRE = FP7→Horizon2020、という構図しか見てなかったなあと気付いたので。いや、この理解はまっとうなものだと思うけど、もしかしたらねらいはそれだけじゃないんじゃ、という気がしてきて。

以下、記述の典拠はほぼすべてZENODOのサイト。

名称

運営元

  • 2013年5月リリース。OpenAIREplusプロジェクトのもと、CERNが開発。[*2]
  • 旧OpenAIRE Orphan Record Repository。[*3]

ポリシー

  • オープンなリポジトリで、だれでもデポジットできる。欧州の研究者じゃなきゃだめとは書いてない。[*4]
  • どんなファイルでもOK。ネガティブな結果でもOK。[*5]
  • 現在のレコード数は6474件で、Software(1821件)が2番目に多い。GitHub連携の結果かな。
  • 既存の機関リポジトリサブジェクトリポジトリの隙間をカバーしたいようだ。My Open Archiveみたいだ。[*6]

ねらい

以下のwebinarの資料p.6に注目したい。

CERNLHCのデータは100PBを超え、25PB/年のペースで増えているそうだ[*7]。そんなビッグデータ=headを所持しているCERNが、ZENODOというリポジトリを使ってtailのほうへ手を伸ばしていると理解すればいいのだろうか。

http://www.eifl.net/news/openaire-webinar-zenodo-recording-and-slides

f:id:kitone:20141223224105j:plain

インフラ

機能的特徴

  • GitHubやORCID iDでもログインできる。
  • ファイルはローカルハードディスクからだけじゃなく、Dropboxからもアップロードできる。
  • ファイルサイズは2GBまで。
  • ファイルの公開状態はopen, closed, embargoedの3種類が選べる。エンバーゴの場合は指定した日時が来たらファイルが公開される。
  • ライセンスはいろいろ選べる(CCだけじゃない。全部で96種類あった)
  • DataCiteのDOIが付与されるhttps://zenodo.org/record/13342 ⇔ 10.5281/zenodo.13342)。[*9]。
  • APIあり。https://zenodo.org/dev
  • メタデータのライセンスはCC0。[*10]。
  • メタデータはOAI-PMHで提供される。ベースURLは https://zenodo.org/oai2d
  • 詳細画面では、ZIPファイルの中身がプレビューできる。
  • Altmetricドーナッツが表示される(例:http://zenodo.org/record/13101
  • community collectionsという、コレクションを作れる機能がある。

FP7/Horizon2020との関わり

アップロード画面

今回ORCID iDでアカウントを作ってみた。アップロード画面がよくできてるなあという印象。

f:id:kitone:20141223223031p:plain

*1:ZENODO is derived from Zenodotus, the first librarian of the Ancient Library of Alexandria and father of the first recorded use of metadata, a landmark in library history.

*2:Really, who pays for this? - ZENODO is developed by CERN under the EU FP7 project OpenAIREplus (grant agreement no. 283595).

*3:OpenAIRE Orphan Record Repository got a make-over and was re-branded as ZENODO.

*4:An open digital repository for everyone.

*5:ZENODO accept any file format as well as both positive and negative results.

*6:ZENODO builds and operate a simple and innovative service that enables researchers, scientists, EU projects and institutions to share and showcase multidisciplinary research results (data and publications) that are not part of the existing institutional or subject-based repositories of the research communities.

*7:How much storage do CERN have available? - ZENODO is currently a drop in the ocean. CERN currently stores more than 100PB of physics data from the Large Hadron Collider (LHC), and produces roughly 25PB per year when the LHC is running.

*8:All data files are stored in CERN Data Centres, primarily Geneva, with replicas in Budapest.

*9:https://www.datacite.org/about-datacite/members/cern-european-organization-nuclear-research.html

*10:All metadata is licensed under Creative Commons Zero, while the data files may be either open access and subject to a license described in the metadata or closed access and not available for download.

*11:Is ZENODO only for EU-funded research? - No. We are open to all research outputs from all fields of science regardless of funding source. Given that ZENODO was launched within an EU funded project, the knowledge bases were first filled with EU project codes, but we are keen to extend this to other funders with your help.

*12:ZENODO is integrated into reporting lines for research funded by the European Commission via OpenAIRE

*13:https://www.openaire.eu/search/datasource?datasourceId=opendoar____::358aee4cc897452c00244351e4d91f69

*14:アップロード画面のFundingのところに "Note, a human ZENODO curator will validate your upload before reporting it to OpenAIRE, and you may thus experience a delay before your upload is available in OpenAIRE." とある。