E1604 - ディスカバリーサービスの透明性向上のためになすべきこと
このたび、カレントアウェアネス-E No.266(2014年9月11日刊行)に「ディスカバリーサービスの透明性向上のためになすべきこと」という記事を書きました。
今回は、記事のライセンスとしてクリエイティブコモンズのCC BYを適用しています(参考)。通常ですと、執筆依頼を受けるときに著作権を国立国会図書館に対して譲渡するという旨の回答書を送るのですが、そうではなく、著作権を自分で保持したままカレントアウェアネス・ポータル(http://current.ndl.go.jp/e1604)に対して掲載を許可するというかたちになります。
ってことは、これまでのように国立国会図書館に転載依頼を行う必要もなく、しかも本紙発行と「同時」に自分のブログ掲載することもできるんですよね(それで何が楽しいかというのはさておいて)。
ということで、どうぞー。
Summon,WorldCat Local,Primo Central,EBSCO Discovery Service。膨大な学術情報をセントラルインデクスと呼ばれるデータベースに集積することで,高速な検索を可能にしたウェブスケールディスカバリーサービス(CA1772参照)が登場してはや5年になる。
現在セントラルインデクスは数億件から十数億件という規模に成長しているが,その中身は“不透明”である。ディスカバリーサービスの導入機関にとっては,どんなコンテンツが含まれているのか,抄録や本文まで検索できるのか,表示されているメタデータがどのデータベースに由来するのか,なぜこういう表示になっているのかなどが重要であるが,現状この点が曖昧である。一方,ディスカバリーサービスにコンテンツを提供する出版社やデータベース会社の側には,利用増加などのメリットがあるのかという疑問や,自社のデータベースの存在感が薄れるのではないか,他社コンテンツと比べて不公平な表示がされるのではないかといった不安がある。
こうした状況を改善するため,2012年に米国情報標準化機構(NISO)のOpen Discovery Initiative(ODI)が立ち上がった。図書館,コンテンツプロバイダー,ディスカバリーサービスベンダーの混成チームで活動を進め(E1393参照),2014年6月にはディスカバリーサービスの透明性向上のための推奨指針“Open Discovery Initiative: Promoting Transparency in Discovery”を公表した。ここでまとめられた主な推奨事項は以下のとおりである。
<全体に対する推奨事項>
・常設委員会あるいはワーキンググループを設置し,推奨事項への対応に関する研修やサポートの提供,関係者が議論する場の用意を行い,引き続き課題への対応を進めること。
・コンテンツプロバイダーやディスカバリーサービスベンダーは,推奨事項への対応状況を具体的に表明すること。なお,附録にセルフチェックリストが用意されている。
<コンテンツプロバイダーに対する推奨事項>
・ディスカバリーサービスに対して,少なくとも15項目のコア要素を含むメタデータを提供すること。また可能なかぎり,フルテキスト,抄録,キーワードなどもインデクス作成のために提供すること。これらの項目はKBART(CA1784参照)にもとづいている。
・図書館に対して,ディスカバリーサービスへのコンテンツ提供状況を公表すること。具体的には,提供範囲,提供コンテンツ(メタデータ,抄録,フルテキストなど),自身のプロバイダーとしての区分(出版社,アグリゲータ,抄録・索引サービス,オープンアクセスリポジトリなど),提供先ディスカバリーサービスの4項目を公表すること。また公表を可能にするために,ベンダーと秘密保持契約(NDA)を結ばないこと。
<ディスカバリーサービスベンダーに対する推奨事項>
・図書館に対し,収録コンテンツについて十分な情報を提供すること。まずはタイトルレベルのメタデータとして,タイトル,出版日,識別子,コンテンツフォーマット,コンテンツタイプ,収録レベルの6項目を年4回提供すること。
・コンテンツへの公正なリンキングのために,検索結果の表示,関連度ランキング,リンクの表示順において,企業間の取引関係による差別を行わない(特に自社コンテンツを優先させない)こと。また,複数のコンテンツプロバイダーから同一のコンテンツが提供されているときは,どのプロバイダーへのリンクをどのような優先順位で表示するのか図書館側で設定できるようにすること。
・コンテンツプロバイダーに対して,インデクス作成に適したデータ提供方法を明示すること。ディスカバリーサービス上で影響の出る変更があった場合には通知すること。また,メタデータスキーマには,MARC,MODS,KBART,EAD,ONIX(CA1747参照)など信頼性のある広く使われているものを使用すること。データ転送方法は,OAI-PMH,FTP,ResourceSyncなどが推奨される。
・コンテンツプロバイダーに対し,統計として,検索回数,クリック回数,クリックスルー回数を毎月提供すること。図書館に対しては,検索回数,ユニークユーザ数,クリックスルー回数,検索クエリ上位500件,リファラー上位100件を毎月提供すること。これらの項目はCOUNTER(CA1512参照)との整合性を意識しており,将来的な統合が推奨される。
今回の推奨指針の公表にあわせ,ODIのメンバーでもあるEBSCO社がEBSCO Discovery Serviceの推奨指針対応を発表した。同社はそれに先立つ2014年4月に他社へのメタデータ提供ポリシーの改訂を行っている。
ディスカバリーサービスには様々なステークホルダーが関わっている(E1266参照)。コンテンツプロバイダーがディスカバリーサービスベンダーに,図書館がコンテンツプロバイダーになることもあり,状況はさらに複雑になる。利用者にとって使いやすいディスカバリーサービスを実現するには“透明”なセントラルインデクスの構築が必要だが,そのためには全関係者が協調できる標準的なしくみが求められる。ODIの策定した推奨指針は,KBART,COUNTER,OAI-PMH,ResourceSyncなどの既存の標準を踏まえつつ,その方法を具体的に提案したところに意義がある。
九州大学附属図書館eリソースサービス室・林豊
Ref:
http://www.niso.org/news/pr/view?item_key=3df37319211dad0553e478ca8946b058cd8a275b
http://www.niso.org/apps/group_public/download.php/13388/rp-19-2014_ODI.pdf
http://www.usaco.co.jp/itemview/template44_3_11500.html#discovery_service
http://www.ebscohost.com/newsroom/stories/ebsco-announces-support-for-open-discovery-initiative-recommendations
http://www.ebscohost.com/metadata-sharing-policy
http://www.ebscohost.com/newsroom/stories/ebsco-makes-50-additional-databases-available-through-open-metadata-policy
CA1512 ( http://current.ndl.go.jp/ca1512 )
CA1747 ( http://current.ndl.go.jp/ca1747 )
CA1772 ( http://current.ndl.go.jp/ca1772 )
CA1784 ( http://current.ndl.go.jp/ca1784 )
E1266 ( http://current.ndl.go.jp/e1266 )
E1393 ( http://current.ndl.go.jp/e1393 )