CiNii Dissertationsレビュー

http://ci.nii.ac.jp/d/

2014年5月にその名を聞いてからずっと楽しみにしていたCiNii Dissertationsが昨日ようやくお披露目に。

長年、日本の博士論文データベースといえば、NII-DBRのひとつである博士論文書誌データベースだったわけです(その前身は今はなきNACSIS-IRで、1987年まで遡る。NDL-OPACから博士論文のデータを取り込んでいて網羅性も高いが、書誌情報のみ)。最近は、NDLによる1990年代の博士論文の電子化や、2013年4月の学位規則改正によるインターネット公表義務化が行われ、各大学の機関リポジトリやNDLデジタルコレクションで博士論文の本文が公開されるようになってきています。こうしたオープンアクセス化の進展を受けて、新たに、博士論文本文までナビゲートできるまとまった(そしてモダンな)データベースが必要になったということなんでしょう。

これとタイミングを合わせるかのように、2013年度の学位論文のインターネット公表状況を調査した報告書が公開されたのもめでたいです。
http://current.ndl.go.jp/node/28636



さて。CiNIi D、さっそくいろいろいじってみました。Facebookにいろいろ書いたんですがここにもまとめておきます。3点目と4点目が大きな課題かなあ。

  • 現時点では、総データ数は591,824件?(学位授与大学名「大学」で検索した結果と「NOT 大学」で検索した結果の和)。いちばん古いのは1923年、いちばん新しいのは2014年12月かな。
  • 検索画面の「本文あり」は要旨PDFのみが存在するという場合も含んでいて、利用者の一般的な認識とはズレる。この点はうちの学位論文ブラウズ画面を作ったときにも悩んで、最終的に「本文あり」⇔「メタデータのtextversion=ETD, publisher, author」という定義にした(そのためにtextversionをかなり修正する必要があった。。)
  • 機関リポジトリからメタデータのみ(PDFなし)のレコードをハーベストしてなさそうなので、その分カバー率が落ちてる。(旧制博士のレコードを検索してみると分かる。うちのも1922年のとかが収録されてない。) →【2015/6/13訂正】NIIオープンフォーラムで担当者から直接聞いた話によると、ちょっと嘘みたい。現状、NDL-OPACの書誌に寄せるという統合処理をしているため、NDL-OPACにはないが機関リポジトリにあるというようなレコードが抜け落ちちゃうんだそうな。今後対応していくとのこと。
  • データ更新のインターバルはCiNIi Articles & Booksと合わせて週次になるのだろうか。
  • 検索結果一覧画面の出版年ソートは「年」しか見てないようで、学位授与 "年月日"としてはきれいに並ばない。
  • 詳細画面の右上に「アクセス数」が出てるのが面白い。これはCiNii Articles & Booksにはない(その代わりDissertationsには広告が出てない)。が、リロードしたり他の端末でアクセスしたりしてみてもカウントアップしなかった。どういうしくみなんだろう。クローラー排除とか。
  • 検索画面で「学位授与番号ID」の英訳が「Grant ID」になっているのはちょっと引っかかる(どうしても助成金が頭に浮かんでしまう)。聞いてたらjunii2に合わせてそうしているらしい。
  • Shibbolethログイン時の戻り先URLがおかしい。→あれ、確認したらもう直ってるような。
  • 重複指摘機能がまだなかった。(NDLデジタルコレクション由来のデータで著者情報がなぜか落ちていて重複しているというケースを見かけた。)
  • 論文IDはCiNii Articlesと同じNAIDを使っている。Dissertationsは5始まりの12桁なのかと思いきや、Articlesには11桁も12桁もあるらしい。
  • 今後もCiNiiファミリーは増えていくと思うけど、研究データのときはどういう名前になるのか興味津々。



CiNii ArticlesとIRDBの連携でも同じだけど、全国各地からメタデータをかき集めて統合処理して一箇所で検索させるというのは言うほど簡単ではないはず。「なんだこのkふだfだlfじゃfldさlfじゃなデータはあああああああ!!!!」という感じになりそうです。歴代担当者のご苦労をお察しします。こうやって visibility が上がると「このデータ間違ってる」という指摘が次々と寄せられて、各大学でちまちま修正したりといった作業が発生するのでしょう。

過去に以下のエントリを書いてきたものとしては、CiNii Dissertationsが育っていって(いや、みんなで育てていくんですけど)、これを見れば日本の学位史はまるわかりだ!なんてふうになるといいなあと願ってます。