PMC

CHORUSついでに、PMC(旧PubMed Central)の概要と現状についてメモ。いろいろ分かってなかった。

以下のプレゼン資料(2016.5付け)の情報が新しく、参考にした。
https://publicaccess.nih.gov/Managing_compliance_May_regionals%202016.pptx

4種類のデポジット方法

NIH(米国国立衛生研究所)のパブリックアクセス方針では、2008年に助成研究成果論文のPMCへのデポジットが義務化された。

デポジットの対象には出版社版(version of record)と著者最終稿(author manuscript)の2種類があり、デポジットの主体には論文著者とジャーナル出版社の2種類がある。従って、デポジット方法には2 x 2 = 4通りの方法があり、次のように呼ばれている。

https://publicaccess.nih.gov/submit_process.htm
http://www.ncbi.nlm.nih.gov/pmc/about/submission-methods/

著者最終稿のデポジットはPMCに直接ではなく、NIH Manuscript Submission (NIHMS) systemというシステムを使う。ファイルフォーマットはWordや画像ファイルなどさまざまなものを受けつけている。Method DはCHORUSに近い感じと言えなくもないが、PMCで公開するためには著者が確認しないといけないらしい。
https://www.nihms.nih.gov/db/sub.cgi
https://www.nihms.nih.gov/db/sub.cgi?page=faq#format

以下でその理由について触れられていた。

著者原稿のデポジットは、著者、スタッフ、もしくは出版者が行えますが、最終的にそのプロセスを完了させるのは著者でなければなりません。公開される原稿のXMLバージョンが正確であり、当該著者の著作であると確認できるのは、著者のみです。
https://www.nii.ac.jp/sparc/event/2009/pdf/6/doc_Dr_Neil_Thakur_jp.pdf

出版社がデポジットするときは(出版社版でも?著者最終稿でも?)JATSでフォーマットするんだろうか。
http://www.ncbi.nlm.nih.gov/pmc/about/faq/#q15

著者最終稿の見せ方

機関リポジトリで著者最終稿を公開するときは、Wordファイルか、それをそのまま変換しただけのPDFファイルを使うことが一般的だろう。

PMCでは、XMLを採用してるおかげで、著者最終稿でもレイアウトが整っていて読みやすい。出版社版と区別がつかないから、目立つように縦に"Author Manuscript"とある。著者最終稿っていうのはこういう見せ方をしてもいいものなのか、と驚く。出版社版との区別のために見た目をいじってはいけないものだと理解していたけど、独自のスタイルを当てるのはいいんだろうか。それともPMCが特別扱いってことなんだろうか。

http://www.ncbi.nlm.nih.gov/pmc/about/authorms/

f:id:kitone:20160823152023p:plain

モニタリングコンプライアンス

2016年5月付けのプレゼン資料の中で、NIH助成を受けた研究成果論文のうち、6割は著者最終稿で、4割は出版者版とある。(これだけ読むとデポジット率が10割と受け止められるが、デポジットされた論文のうち、ということなんだろうか。)

f:id:kitone:20160823152429j:plain
https://publicaccess.nih.gov/Managing_compliance_May_regionals%202016.pptx (p.16)

著者最終稿の月別投稿数については公式のグラフが公開されている。
https://www.nihms.nih.gov/stats/

https://www.nihms.nih.gov/stats/aggregate.png

ちょっと古い数字になるが、全体のコンプライアンス率(compliance rate)については、2012年3月付けの資料のなかで「75%」とある。

This policy, and its subsequent fine tuning, has led to a dramatic increase in the number of NIH papers posted to PMC. Since 2008, NIH has been able to collect over 260,000 papers under the Policy. Overall, the compliance rate stands at 75 percent and continues to edge upward.
https://www.whitehouse.gov/sites/default/files/microsites/ostp/public_access-final.pdf
via: http://blogs.nature.com/news/2013/07/nih-sees-surge-in-open-access-manuscripts.html

義務化前の話になるが、

2006年1月に,NIHは連邦議会に対してパブリックアクセス方針の履行状況についての報告書を提出した(4)。それによると,2005年5月2日から12月31日の8か月間で,同方針の対象となる論文約43,000編(推定値)のうち,実際に登録されたのは1,636編で登録率は3.8%(推定値)であった(もともとPubMed Centralに登録されている雑誌に掲載された論文や,2005年5月以前に発表された論文は該当しない)。
(中略)
3.8%という登録率の低さは,当初の目的と照らし合わせれば任意登録が政策としても戦略としても失敗に終わったと見てよいだろう。
(中略)
将来オープンアクセスの歴史が記される場合,NIH パブリックアクセス方針は必ず言及される出来事である。このまま壮大な失敗として終わるのか,それとも偉大な失敗として華々しい成功への転身をはかるのか
http://current.ndl.go.jp/ca1600

という当時の評価を読むと、現在の成功っぷりが感慨深い。

なお、機関担当者向けのモニタリングツール「Public Access Compliance Monitor」も提供しているようだ。

http://www.ncbi.nlm.nih.gov/pmc/utils/pacm/
http://www.ncbi.nlm.nih.gov/pmc/utils/pacm/static/pacm-user-guide.pdf


検索フィルター

https://www.nlm.nih.gov/pubs/techbull/ja16/ja16_pmc_filters_ref_list.html
https://www.nlm.nih.gov/pubs/techbull/nd15/nd15_pmc_filters_commons_articles.html

https://www.nlm.nih.gov/pubs/techbull/ja16/graphics/pmc_fig1.png

先日、PMCに新しいフィルターが追加された。

  • Author manuscripts(以前から?)
  • Digitized back issues
  • Open access
  • Retracted(以前から?)
  • Include embargoed articles

ここで、"Open access"は通常イメージしてしまうものではなく、Creative Commonsライセンスが適用されていて、再利用(reuse)も可能なものを指している。いや、これが正しくOAだろと言われたら返す言葉はないが。パブリックアクセスときちんと区別してるんだろう。

テキストマイニング等の用途で使えるよう、「Open Access」のもの全体や、著者最終稿全体でデータセットを作成して、バルクダウンロードできるようになっている。行き届いている。

The PMC Open Access Subset some or all openaccess content is a part of the total collection of articles in PMC. The articles in the OA Subset are made available under a Creative Commons or similar license that generally allows more liberal redistribution and reuse than a traditional copyrighted work.
http://www.ncbi.nlm.nih.gov/pmc/tools/openftlist/

The PMC Author Manuscript Collection (“Collection”) consists of articles in author manuscript form that have been made available in PMC in compliance with the NIH Public Access Policy or similar policies of other funders.
http://www.ncbi.nlm.nih.gov/pmc/about/mscollection/

また、retractされた論文もデータベースから削除するのではなく、検索・表示できるようにしているのもすごい。

PMC will not remove articles from its archive. However, in the event that a publisher discovers a serious problem with an article that exceeds the need for a simple correction or erratum notice, such as in cases of scientific misconduct, plagiarism, pervasive error or unsubstantiated data, then the journal must publish a notice of retraction.
http://www.ncbi.nlm.nih.gov/pmc/about/guidelines/#retract

f:id:kitone:20160823154701p:plain

http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3151530/