基因組數(shù)據(jù)共享將生物醫(yī)學研究推向快車道,但向公共領(lǐng)域發(fā)布的現(xiàn)有數(shù)據(jù)指南一方面承認免費和無條件使用數(shù)據(jù)的重要性,另一方面還未能解決這種重要性與數(shù)據(jù)生產(chǎn)者首次發(fā)布數(shù)據(jù)的“權(quán)利”之間的關(guān)系。
在美國能源部聯(lián)合基因組研究所負責人Nikos Kyrpides看來,這種自相矛盾導致了數(shù)據(jù)生產(chǎn)者和數(shù)據(jù)使用者對公共數(shù)據(jù)的使用有著不同的解釋和持續(xù)的爭論。
“根源在于缺乏數(shù)據(jù)使用的明確指導原則。”在接受《中國科學報》采訪時,Kyrpides再次強調(diào),公共數(shù)據(jù)應該被視為開放資源,不受限制地被用于分析、解釋和發(fā)布。相關(guān)論文近日在線發(fā)表于《科學》。
時不時遇到“軟障礙”
公共基因組數(shù)據(jù)使用自由是國際生命科學研究領(lǐng)域的傳統(tǒng)與共識,自人類基因組計劃實施以來,大量的開放共享基因組數(shù)據(jù)信息極大地促進了生物醫(yī)學研究的進步。
1990年啟動并有我國參與的人類基因組計劃被看成科學史上的偉大工程,3年前,該計劃負責人Eric Green、James Watson和Francis Collins在《自然》上撰文總結(jié)了人類基因組計劃的6點經(jīng)驗,其中之一是數(shù)據(jù)共享最大化。
正是人類基因組計劃改變了生物醫(yī)學研究的數(shù)據(jù)共享原則,促成了1996年百慕大原則,即同意將超過一定規(guī)模的基因組測序數(shù)據(jù)在產(chǎn)生后的24小時內(nèi)提交到公共數(shù)據(jù)庫。
一直以來,促進數(shù)據(jù)共享仍在繼續(xù)并有新的變化。2003年勞德代爾堡協(xié)定重申和擴大了百慕大原則,認為大規(guī)模基因組序列數(shù)據(jù)的預發(fā)布對科學界有巨大的益處,同時指出數(shù)據(jù)共享限定在團體資源項目。
自該協(xié)定簽署以來,實現(xiàn)更廣泛、更快速、更有效的數(shù)據(jù)共享成為學界反復討論的主題。
在數(shù)據(jù)共享大背景下,學術(shù)論文在發(fā)表時,一般都會公開并共享相關(guān)的基因組數(shù)據(jù)。“但是政府資助的各類科研項目產(chǎn)出的基因組數(shù)據(jù),數(shù)量更為廣泛,在論文發(fā)表前共享程度極低。”中國科學院—馬普學會計算生物學伙伴研究所研究員張國慶告訴《中國科學報》。
張國慶使用國際基因組數(shù)據(jù)時曾被要求填寫申請,“但由于審核機制不透明,導致時不時地遇到‘軟障礙’”。
“數(shù)據(jù)共享政策并不是一成不變的,許多資助機構(gòu)已經(jīng)對政策進行了微調(diào)。”Kyrpides介紹,比如2014年美國國立衛(wèi)生研究院制定的基因組數(shù)據(jù)共享政策,正在創(chuàng)造一個更完善的數(shù)據(jù)共享生態(tài)系統(tǒng),“這是以前協(xié)定所沒有的”。
“這不是自相矛盾嗎”
事態(tài)的發(fā)展“證明勞德代爾堡協(xié)定已過時,需要對其修訂以反映科技現(xiàn)狀”,Kyrpides認為,協(xié)定通常局限于良好的團隊資源項目,但不包括所有測序項目。
在接受《中國科學報》采訪時,Kyrpides還指出勞德代爾堡協(xié)定的矛盾之處。根據(jù)協(xié)定,向公共領(lǐng)域發(fā)布的數(shù)據(jù)是任何人都應該且能夠不受任何限制地使用的,并且規(guī)定這些數(shù)據(jù)要在出版之前發(fā)布,以便讓整個團體從中受益。
這些年,基因測序產(chǎn)生了無數(shù)的數(shù)據(jù)集,其中許多數(shù)據(jù)集在沒有出版的情況下公開發(fā)布。但協(xié)定同時又提到,“想要使用未公布的公共數(shù)據(jù)的人應首先得到數(shù)據(jù)生產(chǎn)者的許可”,Kyrpides表示,“這不是自相矛盾嗎”。
研究人員也提到了贊成限制公共基因組數(shù)據(jù)使用的人通常有兩個理由,一是未驗證的預發(fā)布數(shù)據(jù)可能包含錯誤,二是生成新的數(shù)據(jù)往往需要耗費很長時間。
在張國慶看來,數(shù)據(jù)使用受限主要原因是數(shù)據(jù)的相關(guān)權(quán)益不清晰,難以保證樣品提供、數(shù)據(jù)產(chǎn)出、數(shù)據(jù)管理、數(shù)據(jù)分析等各方的利益。
此外,基因組數(shù)據(jù)相關(guān)的個人信息的安全管理要求不清晰也是一方面原因,比如敏感數(shù)據(jù)。
“我們承認,對于現(xiàn)有的敏感人類基因數(shù)據(jù),一些限制可能是適當?shù)摹?rdquo;Kyrpides也表示。
不過,研究人員發(fā)現(xiàn)對分享敏感數(shù)據(jù)的抵制正逐漸得到緩解。縱觀整個生物醫(yī)學文獻,2015年至2017年,約有1/5已發(fā)表的文章共享原始數(shù)據(jù),較前幾年大幅度增加。
確定使用原則
“不受限制地使用公共數(shù)據(jù)應該與學術(shù)界的獎勵制度保持一致。”Kyrpides認為,資助機構(gòu)需要認識到數(shù)據(jù)共享的意義,并向生成數(shù)據(jù)的科學家授予適當?shù)臉s譽。
同樣重要的是,“要確定有效的方法,為描述數(shù)據(jù)生成后,協(xié)議以及特定數(shù)據(jù)集的生成提供支持”。Kyrpides告訴記者,更要重新審視資助機構(gòu)和期刊出版商的數(shù)據(jù)發(fā)布策略。
研究人員認為,期刊出版商需要重新考慮出版政策,即在手稿提交出版時數(shù)據(jù)的可用性。Kyrpides等人建議,序列數(shù)據(jù)及其相關(guān)的元數(shù)據(jù)需要在手稿提交同行評審時與詳細協(xié)議一起免費提供,而不是在發(fā)表后。
“要推進基因組學領(lǐng)域的發(fā)展,就需要制定強有力的政策,促進開放和不受限制的數(shù)據(jù)共享,促進包容性的團體驅(qū)動的研究和培訓。”Kyrpides說。
中國-博士人才網(wǎng)發(fā)布
聲明提示:凡本網(wǎng)注明“來源:XXX”的文/圖等稿件,本網(wǎng)轉(zhuǎn)載出于傳遞更多信息及方便產(chǎn)業(yè)探討之目的,并不意味著本站贊同其觀點或證實其內(nèi)容的真實性,文章內(nèi)容僅供參考。