読者です 読者をやめる 読者になる 読者になる

四大ウェブスケールディスカバリーサービスのインデクス収録件数は?

プレゼンの準備をしながら適当な小ネタをブログにすることが続いておりますが……(吐血



ディスカバリーサービスのうち統合インデクス(central index)を持つものがウェブスケールディスカバリーサービス(あるいはより分かりやすくindex-based discovery serviceとか)などと呼ばれ、既存のサービスには例えば以下の四つがあります(飯野さんの記事では「BIG4」と紹介されています)。

  • WorldCat Local / OCLC
  • Primo Central Index / Ex Libris
  • Summon / Serials Solutions
  • EBSCO Discovery Service / EBSCO

ウェブスケールディスカバリーサービスの最大の特徴はその検索範囲の広さにあり、それは統合インデクスの収録件数(=ウェブスケールディスカバリーサービスで検索可能なコンテンツ数)として数値化されます。

じゃあ上記のサービスのインデクス件数はいったいどれくらいなのか? はっきりしたところがよく分からないなあとずっと感じていたのですが、改めて調べてみてもやっぱり曖昧だなあと思ったしだいです。とりあえず結果をメモしておきます。まあ、レースは十数億というあたりに差し掛かっているのは間違いないところなんでしょう。どこまで続くんでしょうね。

WorldCat Local

更新日は分かりませんが、WorldCat Localのトップページに“1.298 billion”とあります。約13億。
http://www.oclc.org/worldcat-local.en.html

  • 977+ million articles with one-click access to full text
  • 37+ million digital items from trusted sources like Google Books, OAIster and HathiTrust
  • 15+ million eBooks from leading aggregators and publishers
  • 30+ million pieces of evaluative content (Tables of Contents, cover art, summaries, etc.) included at no additional charge
  • 238+ million books in libraries worldwide

トップページに書いてあるとわかりやすくていいよね。

【追記】id:otani0083 が教えてくれましたが、こんなページがありました。こちらには“1.304 billion”とあるのでより新しい情報と言えそうです。
http://www.oclc.org/worldcat-local/content.en.html


Summon

Summonのサイトには見当たらなかったので最近のプレスリリースを読んでみました。2013/10/9付で以下の情報あり。14億。
http://www.serialssolutions.com/en/press_room/detail/international-publisher-agreements-expand-summon-discovery-service-content

The Summon service index contains more than 1.4 billion items in which the vast majority of article and book content is full-text searchable.

なお、Summonはサイトで収録データベースのリストを公開していてありがたい。
http://guides.lib.kyushu-u.ac.jp/CuteSearchGuide
http://www.serialssolutions.com/en/services/summon/content-and-coverage/


Primo Central Index

公式サイトに“hundreds of millions”という常套句がありました。数億。
http://www.exlibrisgroup.com/category/PrimoCentral

The Primo Central index is a mega-aggregation of hundreds of millions of scholarly e-resources of global and regional importance.

プレスリリースを見たり“primo central index millions”などとぐぐりまくったけど、これ以上のことはよく分からず。

【追記】これも id:otani0083 からの情報ですが、海外の某大学が部外秘と記されたコレクションリストをウェブで公開していました……。

EBSCO Discovery Service

PCIと同じくよく分からない。件数をほのめかすような文言が見当たらない。2011年1月にウェブスケールディスカバリーサービス特集を組んだ『Library Technology Reports』47(1)を開くと、p.30に以下の記述がありましたが……。

At time of writing, the base index underlying the EDS service includes content from nearly 20,000 providers, in addition to metadata drawn from tens of thousands of book publishers. This base index presently includes metadata for more than 45,000 journals, more than 800,000 CDs/DVDs, nearly six million books, and more than one hundred million newspaper articles; this base index is searchable by all EDS customers.

なお、EBSCO日本法人が新規追加コンテンツの情報を日本語で出してくれています。
http://www.ebsco.co.jp/e-solution/about_eds.html



なにか情報お持ちの方、いただけたら泣いて喜びますー。