NII学術情報基盤オープンフォーラム2017 #SINET5

今年もNIIのオープンフォーラムに出張で参加してきた(3年連続かな)。

思うところはあらかたツイートしたけど、所感を簡単にまとめておきたい。(トゥギャれよ、と言われそうですが、私はTogetterにログインできない病にかかっており……誰か頼みます……。)

リポジトリトラック「学術機関リポジトリの最新動向 - オープンアクセスリポジトリ推進協会(JPCOAR)の取組み -」

http://www.nii.ac.jp/csi/openforum2017/track/day1_4.html

会場は昨年と同じ、250名も入る大部屋。そしてなんか犬がいた。

さすがに関係者なのでJPCOARの活動報告部分は新鮮味がまったくなかったりする(ので詳細は割愛します)。質疑で「オープンアクセス方針策定ガイドにはライセンスがついてないが自由に使っていいのか?」とあったのは、片手落ちで大変申し訳なく。。

JAIRO Cloudの話はノンユーザとして興味深く聞ける。今年夏にリリースされる予定のJAIRO Cloudの新機能のなかでは、

  • DOI付与条件チェック
  • DOI付与済アイテムの非公開化・削除防止
  • JAIRO Cloudで雑誌のカバー画像を登録・表示可能に

が気になった。

3点目については、昨年度リリースされたJAIRO Cloud→ERDB-JPの連携があるのだから、この画像のURLもERDB-JPに反映させて表示するところまでやってほしい。その際にはERDB-JPで採用しているKBART2拡張に当該要素を追加する必要があるだろう(ついでに姓しか入力できないfirst_authorという残念要素をなんとかしてほしい)。
https://erdb-jp.nii.ac.jp/ja/content/metadata_schema

ほか、東洋大学の後藤さんのプレゼンは、聞き手に向けたメッセージが明確に絞り込まれていて、元気で、さわやかだった。

JAIRO CloudのORCID対応に関する質疑も重要。

現時点では資料が公開されていないけど、片岡さんのプレゼンでは、これまであちこちで「CiNii for Data(仮)」と称されていたサービスの画面案が「CiNii Research」として紹介された。資料のうちこのページは公開されないとか……。

自分のプレゼンのメモ

メタデータスキーマ改訂の背景―なぜ新しいスキーマが必要なのか?―
http://www.nii.ac.jp/csi/openforum2017/track/pdf/20170607PM_R_07_hayashi.pdf

持ち時間は10分と短く、内容的にも完全に前座なので、ライトニングトークの気分で、勢いよく、早口で、メッセージだけを残すようなイメージで話すことにした(それが成功したかどうかは分からない)。5分で終わるかなと思ったけど、7分くらいだった。

文字起こしするとこんな感じ:

  • この後はメタデータの話が2つ続くので、前座としてふわっと聞いていただきたい。
  • 2005年のjunii2、2017年のJPCOAR Schema。12年経ってそろそろ改訂すべきだと思ってもらえるならそれでいい。
  • あるいは抽象的な基本方針を読んで納得していだけるようならそれでいい。
  • でも大半のひとは???ですよね。それはまずいと思っている。メタデータの入力で大切なのはビジョン。入力したデータが最終的にどうやって活用されるのかというイメージを共有することが、クオリティの高いデータの維持につながっていく。
  • その例として最近Unpaywallというブラウザ拡張機能がリリースされた。これをインストールして電子ジャーナルの論文を表示すると、そのOA版があるかどうかがアイコンで示される。Unpaywallの背後ではoaDOIというサービスが世界中のOAコンテンツを集めて整理している。
  • ここで大事なのはメタデータ、厳密なメタデータである。みなさんが入力したしっかりしたメタデータが、こういうふうにしてユーザの役に立ちうる。そのためにjunii2より厳密なJPCOAR Schemaを開発している。

コンテンツトラック「これからの学術情報システムは何を目指すのか : 所蔵目録から情報資源の発見とアクセスへ」

http://www.nii.ac.jp/csi/openforum2017/track/day2_6.html

これから(略)委員会の活動については、私自身は部外者ではあるけれど、公表されている報告書を読んでいればそんなに目新しい情報はない感じだった。
http://www.nii.ac.jp/content/korekara/2017/03/nacsis-catillnacsis-cat28.html

前日のリポジトリトラックで聞いたJAIRO Cloud→ERDB-JP連携機能は、JCだけが対象かと思いきや、北山さんのプレゼンを見ていたら単なるファイル渡しっぽいしどんなシステムでも対応できるんだろうなと気づく。これはやってみよう。

本トラックの個人的なハイライトはここ。LSPってそういうもんだし、まあそうなりますよねっていう感じではあるんですが、それをバーンと出しちゃうのがこのひとたちのすさまじさだなあと改めて。

f:id:kitone:20170617170923p:plainhttp://www.nii.ac.jp/csi/openforum2017/track/pdf/20170608PM_Cont_02_iino.pdf#page=51

あと、ぽろっと漏らしたこれが妙に……。


研究データトラック「研究データ管理のための新サービス提供に向けて」

残念ながら資料は公開されないらしく。
http://www.nii.ac.jp/csi/openforum2017/track/day2_5.html

今年4月に設立されたNIIのオープンサイエンス基盤研究センター。そこで現在開発中の研究データ管理基盤(Open Science Frameworkベース)・公開基盤(JAIRO Cloud for Data?)・検索基盤(CiNii Research?)について、参加者からフィードバックをもらいたい、という感じのイベントだった。

最初に込山先生から簡単なプレゼンがあり、あとはこんなプログラムでひたすらフロアとのディスカッション(自分もコメント役を仰せつかり……)。

  • 機関のニーズ(学術機関の情報基盤センターとの連携)
  • エンドユーザのニーズ(研究者からの要望)
  • 開発とデプロイ(情報システム関連企業との連携)
  • 自由テーマ(図書館との連携など)

この構成からも分かるように、主に情報基盤センターや研究者を対象にし、大学/研究図書館員は必ずしもメインターゲットではなかった。

ディスカッションで印象に残ってる発言は、

  • 研究者が学外へ異動した場合のアカウントの引き継ぎをどうするか。
  • 公開はリポジトリ=図書館、というのは本当に正しいんでしょうか。
  • ウェブからだけというのは使いづらいので、UIを増やしてほしい。
  • 誰がどうしたかという操作ログを残すようにしてほしい。
  • 事務や学生も使いたがるのではないか。
  • 機関とドメイン。データサイズが大きいときにどちらに置くのが適切なのか、悩んでいる。
  • 大容量ストレージが必要になった場合にJAIRO Cloudを従量課金制にするかという問題がある。

あたり。

特に機関とドメインの問題は本当に難しい。研究者のスタイルに即すのであればドメインという観点を主にするほうが良いんだろうけど、それで管理業務がうまく回っていくのかどうか……。

今後は、今年秋頃に第2回のクローズドαテストを開始する予定という。平成32年度の本格運用を目指して、開発・実証実験・試験運用を進めていくというスケジュールらしい。

自分のコメントのメモ

事前に、図書館の立場から管理基盤→公開基盤の連携などについてコメントしてほしいと依頼されていた。

困ったなぁ、何を話そうか……と

  • そもそも公開基盤側は具体的にどんな作業をすることになるのかが見えてないや。
  • システム側で研究データ公開のインセンティブをどう作るか。Web of ScienceのData Citation Indexへの収録、大学の研究者データベースとの連携(業績としての入力)、とか?
  • 図書館としては、手違いでデータが公開されてしまう、が怖い。論文はすでに公表されてるものだからダメージが少ないが、データはそうでもない。
  • 古典籍などのデジタル化画像(デジタル・ヒューマニティーズ)は研究データ管理基盤のスコープ?

というようなメモを作っていた。

込山先生のプレゼンや続くディスカッションを聞いていて、

  • DOIを登録する粒度はどうなるんだろう。OSFではプロジェクトという単位で研究データを管理するらしいが、そのうち一部のファイルをグルーピングして公開基盤(どこかの機関リポジトリ)に渡し、そのグループに対してDOIを振る、というのができるのかどうか。1プロジェクト=1 DOIというのは辛そう。
  • 複数機関の研究者が関わっているプロジェクトの場合、研究データをどの機関リポジトリで公開するのかという問題が起こる。研究データは文献と違ってデータサイズが大きくなるので、複数の機関リポジトリで重複して公開するのはストレージの無駄になるので、なんらかのポリシーを決める必要があるか(例えばOpenAIREではファンドを受けたP.I.が所属機関のリポジトリに登録するというガイドラインになっているらしい)。しかし、そうなると、公開先として選ばれなかった他の機関リポジトリと大学業績データベースの連携が難しくなるか……公開先として選ばれた機関リポジトリ→ORCID→プロジェクト関係者の大学の業績データベース、と流していくのが無難か。

というあたりが気になってきた。

で、結局こんな感じのことを発言した。


余談

東京に行くときはいろいろ組み合わさることが多いですが、今回は

  • 6/6(火):移動日
  • 6/7(水):メタデータな打ち合わせ、リポジトリトラックで登壇
  • 6/8(木):コンテンツトラック、研究データトラックを聴講
  • 6/9(金):京都へ移動、カレントアウェアネス編集企画会議@NDL関西館

という旅程だった。

昨年のオープンフォーラムは最終日に羽田空港大韓航空の事故があってわちゃわちゃしたのを思い出す。今年は3種類の用務に3者のスポンサーが組み合わさる出張なので行くまでの調整にえらく手間取った。。

木曜日は手頃なホテルが予約できず、東銀座駅上にあるTHE PRIME POD銀座に泊まってみた。最近増えてる、こじゃれたカプセルホテル。オスプレーをパンパンにした女性とか、外国人バックパッカーが多かった。しかし、このロケーションで3800円というのはすさまじい。ドライヤーがシャワールームのなかにあるので髪を乾かすときにちょっと暑い、以外にさしたる不満はなかった(そりゃ洗面台でやったらうるさいから仕方ないんだけろうけど。でもファーストキャビンはバスルームエリアがゾーニングされてたっけな)。ねぼすけの自分には、他のひとのアラームとそれまた他のひとの舌打ちとで自然と目が覚めるシステムは悪くない。

火曜日は移動日ってことで、ぐすたふ珈琲→SyuRo→蕪木と巡ってきた。SyuRoのおねーさんに薦められたままに入った蕪木はすてきな空間だった。。某お菓子会社出身のマスターが淹れてくれた、たしかにバナナのようになめらかな舌ざわりのホットチョコレートにニマニマした。

過去の記録