Jisc Publications Router

Jiscが2016年8月から以下のサービスを正式に開始すると発表しています。2015年からプロトタイプシステムの開発や一部機関との実験を行っていたものです。

Jiscは次のようにライフサイクルに沿ってオープンアクセス関連のサービスを提供しており、その中盤に位置づけられています。

f:id:kitone:20160528171014p:plain

Jisc Monitorはその名の通りオープンアクセスモニタリングのためのしくみで、英国らしくAPCにもきちんと向き合っていてこれはこれで面白いのですが、ここではリポジトリ登録のワークフローを自動化させるPublications Routerについてまとめておきます。

概要

https://pubrouter.jisc.ac.uk/static/img_1_800px.png

  • 出版社等と契約して論文のメタデータとフルテキストを自動的に収集し、メタデータから著者の所属機関を判断してその機関リポジトリやCRISに流す(ルーティング)
  • 現在の契約出版社等:Europe PMC、eLife、PLOS;Springer Nature(まもなく;Springer OpenとBioMed Centralが対象)、CrossRef(予定)
  • 技術的基盤:OAI-PMH、SWORD、FTPAPI
  • 対応システム:EPrints、今後はDSpaceやCRISにも対応予定

自動化によって機関リポジトリ運営側も研究者の手間を省きつつ、コンテンツを増やせるわけです。

https://pubrouter.jisc.ac.uk/
https://drive.google.com/file/d/0B_TI_KU8Rzj7QlZyMjhqNldtZ00/view
https://scholarlycommunications.jiscinvolve.org/wp/2016/04/19/jisc-open-access-services-at-uksg-2016/
https://scholarlycommunications.jiscinvolve.org/wp/2016/05/18/publications-router-monitor-local-and-monitor-uk-to-move-to-full-service-status/
https://scholarlycommunications.jiscinvolve.org/wp/2016/05/20/publications-router-new-publishers-join-and-next-steps/

ポイント

以下、自分がポイントだと理解した点です。

フルテキストが含まれていること

例えばScopusのような2次データベースから自機関研究者の論文メタデータを収集して、研究者に(半)自動的にセルフアーカイブを促すというような取組はこれまでもあったわけです。

Publications Routerはそういったシステムを全国規模で展開しているだけというふうにも見えますが、大きな違いは、論文のメタデータだけではなくフルテキストをも取り込んでいることでしょう。そのために(Scopusのような2次データベースではなく)出版社と直接契約を交わしているわけです。そういう意味で、単なるシステム連携ではないわけですね。

スピード

REF(Research Excellence Framework)では論文のアクセプトから3か月以内にリポジトリに登録することが義務付けられていますが、

PLOS publishes articles within an average 16 days of acceptance (median 13 days), so its feeds to the Router enable participating institutions to add the articles to their repositories within the REF policy’s three-month deadline.
https://scholarlycommunications.jiscinvolve.org/wp/2016/05/20/publications-router-new-publishers-join-and-next-steps/

というスピードで処理してくれるので著者が自分で登録しなくても間に合うという。(Scopusのような2次データベースに採録されるまでのタイムラグはどれくらいなんだろうか?)

エンバーゴへの対応

エンバーゴの存在する論文についても、フルテキスト(とエンバーゴ終了日)が出版社からリポジトリまで流れてくるようになっています。

さらっと読み飛ばしそうですが、これはすごい。その論文はもしかしたら当該機関で契約していなくて読めないものかもしれず、それを悪用しようと思えばできなくもない。そのためにきちんと legal agreement を交わしているんですね。

Some publishers may supply content that is under embargo. If so, we will include the embargo end-date in the metadata. For those articles, you will need to agree to respect these embargoes by signing an agreement with us.
https://pubrouter.jisc.ac.uk/about/institutions/

実際にゴールドOA以外の場合がどれくらい実現するのか、つまり、エンバーゴのある論文や著者最終稿(Author Manuscript)がどれくらい流れてくるようになるのか、というのが気になるところです。期待。

ルーティング

いちばん肝心なところですね。出版社から流れてきた情報を各機関にルーティングする際には、もちろんメタデータの著者所属情報を使います。マッチングのために機関側に対して以下の情報を提供するよう求めています。ルーティング先がうまく決定できない場合は人手で流したりするんだろうなあ……。RingGoldのようなものもありますが、標準化が進んでいない領域ですね。でもORCIDをこうやって使う手があるのか。

To enable Publications Router to send you notifications about the correct articles, you will need to provide us with some key parameters that Publications Router can use to match them to your institution. These include variant names for your institution, post-codes that may occur in its addresses, email domain names that your authors may use, or your researchers' ORCIDs.
https://pubrouter.jisc.ac.uk/about/institutions/

なお、Publications Routerは今後CrossRefのメタデータを取り込むことを考えているものの、

We’ll then do the same for Crossref. Usable coverage here is so far surprisingly quite limited, as most publishers don’t yet populate it with authors’ affiliation details.
https://scholarlycommunications.jiscinvolve.org/wp/2016/05/20/publications-router-new-publishers-join-and-next-steps/

としています。(こういった情報がきちんと管理されてるのはScopusなどの2次データベースのメリットなのかなあ。)

他のサービスとの比較

以下の論文で、SHARE Notify、Jisc Publications Router、OpenAIRE Literature Broker Serviceという同種の取組が比較されています。

Some approaches focused on techniques for automatic deposition into a repository (SWORD project [4]), while others focused on the complementary aspects of how to broker publication information from publishers to relevant/interested repositories. SHARE and JISC/EDINA are two such initiatives, based respectively in the US and UK
http://www.dlib.org/dlib/november15/artini/11artini.html
# 2. Repository Literature Brokers in the literature

どのサービスもあちこちから集めてきたデータをルーティングするという意味では似たようなものなのでしょうが、フルテキストとエンバーゴという二点においてJiscは一歩も二歩も踏み込んでいると理解しました。もっとも、そのうちOpenAIREも同じようなことしてきそうだけど。

疑問

Publications RouterとMonitor Localを含めたトータルなワークフローがちょっとよくわからない。Publications Routerで流れてきたメタデータをもとにMonitor LocalでAPCの管理をするのか、それともMonitor Local側のほうが先になるのか。

先日のPASTEUR4OAのファイナルカンファレンスでJisc Monitorについて詳しいプレゼンがあったものの、そこまでは書かれておらず。
https://blogs.openaire.eu/?p=913
http://www.pasteur4oa.eu/sites/pasteur4oa/files/generic/Frank%20Manista.pdf

今度、CRIS2016/OR2016で尋ねてこよう。