データ共有に対する研究者の姿勢

データ共有に対する研究者の姿勢

データ共有とデータ管理 はきわめて重要であり、これらによりデータが検証可能になります。政府や資金提供機関の中には、助成金申請の際、データ共有プランを包めるよう厳しい命令を課しているところもありますが、学界にとっては、今もなお研究データへのアクセスは課題として残っています。出版業界は、関心を促しインフラの開発を支援することで、データ共有への現実的な障害の低減に役立とうとしています。こうした努力を整えて、データ共有に対する研究者の見解を理解することがきわめて重要です。


世界規模でのデータ共有について研究者がどう感じているかを把握し、分野を超えた研究者間でデータ共有活動に対し明確な意見をまとめようとして、ワイリー(Wiley)は今年初めに調査を行いました。世界各国から健康科学、生命科学、物理科学、社会科学、人文科学に属する約9万人の研究者が調査に参加しました。しかし、回答したのはわずか2886名(3.2%)で、データを共有していると報告したのはそのうち52%だけでした。

ここでは調査で尋ねた質問をいくつか取り上げましょう:

 

どんなデータを共有するのですか?

  • 回答者の82%
    が、スプレッドシートやCSVファイルで作っている
     
  • リレーショナルデータベースを作っていると答えたのは12%のみ
     
  • 共有されているその他の種類のデータには、2D画像や3D画像、実行可能コード/モデル、インタビューの記録、ビデオ/音声記録など
     
  • 共有されたファイルのサイズは比較的小さく、10GBより小さいという回答が60% を超えている
     

どのようにしてデータを共有するのですか?

  • データを共有していると回答した人の67% が、ジャーナル内の補足資料として共有している
     
  • 機関リポジトリにデータを保存している人は28%
     
  • 専門分野固有のリポジトリを使用している人は19%のみ
     
  • Dryad や figshareといった汎用リポジトリをしようしているのは、わずか6%
     
  • 会議の席上で共有(57%) 、メール、直接連絡などにより依頼され共有(42%)のように、形式的要件をみたしておらずインフォーマルなやり方で(多くの場合一時的な方法で)データを共有していると答える研究者が多かった
     
  • データを共有するため、個人・所属機関・プロジェクトのウェブサイトを用いている人が、驚くことに37% にものぼっていた。これは、データ共有命令をみたしている可能性が低く、どんな種類であってもデータの長期的保管(どんな種類であっても)を確実にする方法としてはけして最適ではない
     

データを共有しない主な理由:

  • 資金提供者からの必要条件ではない
  • 出し抜かれることを恐れて
  • データの誤った使用・解釈がなされる可能性
  • IP(知的財産)/守秘義務の問題(特に健康科学の場合)



様々な分野でデータを共有するためのモチベーション:

  • 物理科学、社会科学、人文科学においては、データ共有の主たるモチベーションは、自分たちの研究の知名度と影響力を上げることである
     
  • 生命科学においては、何かしらのクレジット(著者名)・出典が明記されるならば、データ共有したいと思うだろう
     
  • 健康科学では、データにかかわるプライバシーと倫理的問題への懸念が、モチベーションにマイナスの影響を与える



それでは、データ共有活動を改善するため、学術コミュニティはどんな段階を踏めばよいだろうか

調査によると、出版者は補足資料という形で研究データを定期的に受け入れているということです。したがって、データアーカイヴを出版社要件(a publisher requirement)にすれば、データ共有活動は間違いなく改善されるでしょう。次に、資金提供者要件(funder requirements)がないということが、データ共有できない主な理由として挙げられているので、政府などの資金提供者は、研究者に対しより積極的に、データ管理プランの提出を促すべきです。

さらに、研究者はデータストレージのメカニズムの安全性と機密保持を再確認する必要があります。領域固有のリポジトリおよび汎用リポジトリのようなインフラへ継続的支援と投資を行うことで、それらのリポジトリにデータを安全かつ永続的に保管する方法が得られるでしょう。資金提供者や所属機関もまた、データ共有の際、研究者のクレジットを与え出典を明記する方法を見つけるよう努めなければなりません。
 


現段階で必要なのは、広い学術コミュニティにより組織化された活動です。資金提供者、所属機関、出版社、学会が一丸となり、データ引用の基準とベストプラクティスを定めなければなりません。また、データ共有を促す明確なシステムを作り、様々な形態のデータ共有とそれらの効果について透明性を高めることにより、研究者のデータ共有を促すべきです。こうすることで、うまくいけば、研究者の間にデータ共有の文化が培われることでしょう。

 

関連記事【データのシェアはオープンサイエンスへの正しい一歩なのか? もご覧になると面白いと思います。

学術界でキャリアを積み、出版の旅を歩もうとしている皆様をサポートします!

無制限にアクセスしましょう!登録を行なって、すべてのリソースと活気あふれる研究コミュニティに自由に参加しましょう。

ソーシャルアカウントを使ってワンクリックでサインイン

5万4300人の研究者がここから登録しました。

便利さを実感して頂けましたか?

あなたの周りの研究者にもぜひご紹介ください