データのシェアはオープンサイエンスへの正しい一歩なのか?

データのシェアはオープンサイエンスへの正しい一歩なのか?

科学はそのはじまりから、知識の共有による人類の発展を目的としてきました。科学のもともとの方向性は、法的・倫理的問題さえなければ、科学的・学問的背景に関係なく、誰でも研究を自由に利用できるようにするというものです。オープンアクセスは研究者と一般の人が、何ら制限なく科学的知識にアクセスできるようにという信念に沿って作られました。 前の記事で、学術関係者がオープンアクセスについてどう考えているか取り上げています。基礎データが書かれていない論文はあまり役に立たないと論じている人も、以前からいました。こうした意見を重視したPLOSが先日、 「データの取り扱いに関する基本方針(Data Policy)の改定版をリリースしました。2014年3月1日から実施される予定です。PLOSのジャーナルに掲載されるすべての論文で、著者にデータ利用報告書(データがどこでどのように利用できるか書いたもの)を提出してもらいます」と発表しました。この方針は何を意図しているのでしょうか?


PLOSの発表で重要なポイントを見てみましょう。

根拠: PLOSの考えは、「データの利用により、反復、再分析、新たな分析、解釈、メタ分析への算入が可能になり、研究の再現性が促される。これらはすべて、科学的研究からより大きな『効果を得る』ためのものである(“Data availability allows replication, reanalysis, new analysis, interpretation, or inclusion into meta-analyses, and facilitates reproducibility of research, all providing a better ‘bang for the buck’ out of scientific research.”)」 というものです。科学的知識の透明性と入手しやすさが、新方針を打ち出した主な理由としてうたわれています。

 

研究者への要求:

論文を投稿する際、研究者は「最低限のデータセット」を提出しなければなりません。この中には、研究知見を再現するのに必要なメタデータや追加データも含まれます。PLOS は、研究の一部として収集したすべてのローデータを提出する必要はないが、非常に重要な基礎データや論文と関連する基礎データは提出するように、とはっきり述べています。データセットは論文に含めるか、裏づけ情報として提出することができます。公開リポジトリに保管されている場合は、アクセスできるようにしなければなりません。

 

例外: 個人的な特許のデータ、あるいは化石堆積層や絶滅危惧種と関係のある特定の情報といったデータの中には、倫理的・法的制限により共有できないものもがあります。さらに、第三者からのデータを自由に共有することはできません。そういう場合著者は、要請があればデータを利用できるようにすると述べる必要があります。

この発表は学術関係者の間に多くの討論・議論を引き起こしています。新しい方針によって科学に透明性が与えられることから方針を支持する関係者がいる一方で、真っ向から反対している人もいます。賛成意見をあげてみましょう。

 

1. 究の再現性: 科学の進歩は、知識の共有を通じてのみ可能であり、知識の上に築かれます。ですから、もし研究知見や観察結果と同様に、データも自由にアクセス可能であれば、研究者はそれを使って新しい方法でデータを使ったり、データの質を証明したり、研究を反復したりできます。

 

2.科学の急速な進歩: データの入手しやすさは、類似のプロジェクトに従事している研究者の助けになるでしょう。現在進行中の研究における欠陥がデータの共有により補われれば、研究をより速く進ませ、今度はそれが科学の進歩を加速することになるでしょう。I

 

3. タ管理: 著者は、ダウンロード可能な添付資料として論文とともにデータを投稿する、あるいは公開レポジトリにデータを保管し、個々のデータセットに受け入れ番号かデジタル・オブジェクト識別子(DOI)を与えなければなりませんが、今後必要な時のためにデータを管理するのが簡単です。適切に保管されていれば、大きなデータセットもより使いやすくなる可能性があります。


4. 機会が増えること: 公開データ・アーカイブにデータが保管され、それを通じて共有されると、引用も増え、オルトメトリクスのような尺度での研究者の実績が増すことになります。さらに、データの共有により共同研究の機会も増やせます。 

PLOSの副編集長ロリ・ロバーツ(Roli Roberts)氏は、論文とは主としてデータを分析し結論を考察するものだから、論文の中心は基本的なデータである、とブログで言及しています。 ロバーツ氏によれば、科学の論文は、スペースに制約があった過去の形式に従っているため、ローデータが非常に少ないということです。けれども今や、主にオンラインで論文が発表され、オンラインで読まれる時代になったので、公開レポジトリやその他のオンラインリソースへと読者を向かわせ、データを提供することもできます。ですからロバーツ氏は、データの共有が科学の将来をになうべきだと考えているのです。 

ところが、学術関係者の中にはデータ共有の方針について良く思っていない人もいます。理由は次の通りです:

1. 「スクープされる」恐れ: 助成金や大学での職に関する競争、そして一番に発表するという競争は熾烈極まりないものです。したがって、他者が勝手にデータを使うかもしれないため、自分の研究のデータを誰でも手に入るようにすることに懐疑的な研究者も多いです。自分のデータセット全体の優先権や所有権を失うというのは、多くの研究者にとって不愉快なことなのです。


2. 開発途上国の研究者への悪影響: 研究への投資がそれほどない国では、「得られたデータは金のようなもの」です。限られた資金で研究をしているため、開発途上国の研究者はデータからできるだけ多く発表を絞り出したいと思っています。データを公開してしまったら、データを再利用するという選択肢がほとんど残らないことになります。


3. 査読プロセスへの影響: レビューを行うとき査読者が実際にデータセットに目を通しているか疑問に思っている研究者は多いです。また、データの公開が査読プロセスのスケジュールにどんな影響を与えるのか、データの詳細な検査に本当に役立つのかという懸念も表わしています。


4. データ共有にかかるコスト: 公開レポジトリでのデータ保管は費用が高くつくことがあります。そればかりか、倫理的理由からデータを直接共有できない場合は、研究者がデータを変更しなければならないかもしれません。それにはかなりの時間と費用がかかります。 


興味深いことに、PLOSの新方針は、誰もが利用できる添付資料とともに、連邦政府による研究への資金援助に関する昨年のオバマ大統領の演説 を支持しているように見えます。過去数十年間に、一般の人々は科学へだんだん関心を持つようになり、科学の進歩を懸命に見守っています。これをふまえたPLOSの新方針は、科学をより透明性の高いものにすることを意図しています。そのこともまた、データは既成事実である場合のみ広く共有されるべきだと考える研究者にとって、懸念されることです。

PLOSへの投稿とともにデータを手放してもいいと著者が思うかどうか、今はまだわかりません。研究資金が焦点となっていない国の著者の場合は、とりわけそうです。けれども、大部分の学術関係者が、この新方針が実行されればオープンサイエンスに向けた大きな一歩になるだろうと考えています。


今回の問題について皆さんから意見をいただけたら面白いと思います。研究者は今回の変革を受け入れるでしょうか?
新しい方針は、PLOSが出す出版物やPLOSで発表する著者の多様性に影響を与えるでしょうか? 

 

 

学術界でキャリアを積み、出版の旅を歩もうとしている皆様をサポートします!

無制限にアクセスしましょう!登録を行なって、すべてのリソースと活気あふれる研究コミュニティに自由に参加しましょう。

ソーシャルアカウントを使ってワンクリックでサインイン

5万4300人の研究者がここから登録しました。

便利さを実感して頂けましたか?

あなたの周りの研究者にもぜひご紹介ください