作為“綠色超級稻項目”的一部分,“全球3000份水稻核心種質(zhì)資源重測序計劃”(3K–RG)于2011年9月由中國農(nóng)業(yè)科學院、國際水稻研究所(IRRI) 和華大基因共同啟動。2014年5月,3000份水稻基因組測序初始數(shù)據(jù)于“世界饑餓日”公開發(fā)布于NCBI、DDBJ、GigaScience、阿里云等數(shù)據(jù)庫,于全球共享。
日前,3K-RG再獲新進展。北京時間4月26日凌晨,國際頂級期刊《自然》(Nature)在線發(fā)表了綠色超級稻項目首席科學家、中國農(nóng)業(yè)科學院作物科學研究所黎志康博士等人完成的最新成果,剖析了水稻核心種質(zhì)的基因組遺傳多樣性,對水稻的起源、基因、分類和進化規(guī)律進行了深入的探討。
所謂的“綠色超級稻”,其理念在上世紀末開始推出,旨在“少打農(nóng)藥、少施化肥、節(jié)水抗旱、優(yōu)質(zhì)高產(chǎn)”,以適應資源、環(huán)境的急劇變化。而上世紀60年代以來,中國水稻育種已實現(xiàn)兩次重要突破,通過提高產(chǎn)量解決了溫飽問題。
值得一提的是,研究團隊此番在國際長期認可日本學者命名的情況下,對亞洲栽培水稻中“秈”、“粳”兩大亞種恢復了具有“中國味”的秈 (Oryza sativa subsp. xian)、粳(Oryza sativa subsp. geng)亞種的正確命名。
該研究由中國農(nóng)業(yè)科學院作物科學研究所牽頭。中國農(nóng)業(yè)科學院作物科學研究所黎志康研究員、國際水稻研究所Kenneth L. McNally和Nickolai Alexandrov高級科學家、上海交通大學生命科學與生物技術學院韋朝春教授、華大基因張耕耘博士、中國農(nóng)業(yè)科學院深圳農(nóng)業(yè)基因組研究所阮玨研究員、亞利桑那大學Rod A. Wing教授為該篇論文的共同通訊作者。并列第一作者則有中國農(nóng)業(yè)科學院作物科學研究所王文生副研究員、國際水稻研究所Ramil Mauleon博士,上海交通大學博士生胡智強等12人。
論文的通訊作者之一、上海交通大學生命科學技術學院韋朝春教授表示,“我們這個項目最大的好處在于,以前育種專家是靠經(jīng)驗、靠大量組合去試新品種,現(xiàn)在我們把3010份品種的基因組測完之后,相當于給育種專家提供了‘地圖’。”韋朝春舉例,比如需要的目標品種在生長早期要能耐淹、晚期要耐旱,那育種專家可以通過泛基因組數(shù)據(jù)庫把具有這些性狀的親本去找出來,再進行雜交育種,“相比以前成功率會高很多。”
“日本晴”不再是最佳參考基因組
亞洲栽培稻是世界上最古老的農(nóng)作物物種之一,生長于全世界,全球一半人口的主食依賴于它。此前有預計,到2035年需要額外增加1.12億噸糧食才能滿足未來人口增加的需求,但同時種植面積、水資源將更少,氣候條件波動也更劇烈。
這就意味著,擺在育種專家面前的挑戰(zhàn)是,未來的水稻栽培品種要更高產(chǎn)、抗壓能力更強。
而水稻育種改良的遺傳基礎是水稻種群基因豐富的多樣性和復雜的作用機制。長期以來,全球的科學家一直致力于闡明水稻基因組所有基因的功能及其等位基因多樣性與重要農(nóng)藝性狀之間的關聯(lián),并將研究成果運用到水稻遺傳改良中。而以基因技術為核心的分子設計育種,讓水稻育種周期更短、更有針對性,代表了水稻育種的發(fā)展方向。
論文中提到,目前全世界所有基因庫中概有上百萬個水稻品種。在這項研究中,國際水稻研究所提供了來源于89個國家的2500份水稻核心種質(zhì),加上來源中國的500余份代表性材料,最終經(jīng)基因測序、質(zhì)量控制評估后保留3010株水稻的基因數(shù)據(jù)。
這3010株水稻代表了全球水稻種質(zhì)約95%多樣性的核心種質(zhì)。
研究團隊共檢測到2900萬個高質(zhì)量單核苷酸多態(tài)性(SNPs,在基因組水平上由單個核苷酸的變異所引起的DNA序列多態(tài)性),240萬個小片段插入缺失(Indels)。首次揭示了亞洲栽培稻品種間中存在9萬個微細(>100bp)結(jié)構變異(SVs,包括易位、缺失、倒位和重復)。
韋朝春著重提到,以往研究人員采用的Nipponbare RefSeq(粳稻品種“日本晴”測序參考基因組)實際上在操作過程中給育種專家?guī)聿簧倮Щ螅谢驁D譜“不全”之疑。
此番,研究團隊利用3010株水稻基因構建了亞洲栽培稻的泛基因組,發(fā)現(xiàn)了1.2萬個全長新基因和數(shù)千個不完整的新基因。韋朝春表示,“原來的參考基因組大概有373Mb,我們現(xiàn)在新增了268Mb。”
其中,研究團隊在3010份材料中再次挑選出453份測序深度較高的,來分析其核心(core)基因家族和分散式(distributed)基因家族。最后得出,共包括12770個(62.1%)核心(core)基因家族和9050個(37.9%)分散式(distributed)基因家族。核心基因比較古老,大多數(shù)的新基因則表現(xiàn)更年輕和長度偏短。

韋朝春提到,“以前大家可能認為核心基因很重要,而分散式基因不是必須的,但我們測試發(fā)現(xiàn),大部分育種專家認為很重要的、和產(chǎn)量等相關的基因并不是核心基因,而是分布式的。”
這份信息更加豐富的基因數(shù)據(jù)庫終極受益者是育種研究。據(jù)韋朝春介紹,在他們的泛基因數(shù)據(jù)庫中,“你給我一個品種列表,我可以把這些品種共有的基因、特有基因都可以給你列出來,反過來你根據(jù)你的育種目的給我一個基因列表,我的泛基因組數(shù)據(jù)庫可以告訴你有這些基因的品種有哪些。”這些工作只需要數(shù)秒鐘時間就能完成,這在傳統(tǒng)育種工作中是無法想象的。
此前傳統(tǒng)育種主要是依靠水稻表型來作為選擇依據(jù),現(xiàn)階段分子育種技術則是從基因組層面來確定目標性狀,因其同時滿足效率和安全(相對于轉(zhuǎn)基因育種)的要求而備受科學界推崇。
值得一提的是,韋朝春還提到一個小細節(jié)。其團隊在2013年加入該項研究,而這一項目的測序工作實際上早就結(jié)束,但海量的數(shù)據(jù)分析卻面臨技術瓶頸。“所有的測序初始數(shù)據(jù)有15T,在5年前的條件下,光這些數(shù)據(jù)從他們的機器拷下來再拷到我們的機器上,加上反復檢查等因素,前前后后足足花了近半年時間。”
堅持恢復“中國味”命名方式
在水稻研究領域中,育種之外另一大關注焦點是其起源。
中國水稻研究的奠基人丁穎曾極力主張水稻原產(chǎn)中國。此番論文中也提到,亞洲栽培水稻中“秈”、“粳”兩大亞種早在2000多年前的漢代已被人們所認知。丁穎也特意把秈稻定名為秈亞種,粳稻定名為粳亞種。
但秈/粳稻的起源和命名在國際上一直極具爭議。
1928年,日本學者加藤茂范通過雜交等手段發(fā)現(xiàn)了秈稻和粳稻的區(qū)別。然而,加藤隨后把秈稻稱為“印度型” (Oryza sativa L. subsp. indica Kato),把日本栽培極廣的粳稻稱為“日本型” (Oryza sativa L. subsp. japonica Kato)。自此,秈稻和粳稻在國際上就一直沿用“indica”和“japonica”命名至今。
研究團隊認為,這兩個亞種用“印度”和“日本”來命名,很容易使人誤解秈粳的親緣關系、地理分布和起源。
研究團隊在這項研究中對亞洲栽培稻群體的結(jié)構和分化進行了更為細致和準確的描述和劃分,由傳統(tǒng)的5個群體增加到9個。分別是東亞(中國)的秈稻、南亞的秈稻、東南亞的秈稻和現(xiàn)代秈稻品種等4個秈稻群體,東南亞的溫帶粳稻、熱帶粳稻、亞熱帶粳稻等3個粳稻群體、以及來自印度和孟加拉的Aus和香稻。
另外,通過對大量和馴化進化相關基因的單倍型和泛基因組分析發(fā)現(xiàn),秈稻攜帶的很多基因不存在于粳稻中,粳稻的很多基因也不存在于秈稻中。此外,不同地理來源的水稻農(nóng)家品種群體都帶有特異的基因家族。
根據(jù)這些結(jié)果,研究團隊首次提出了秈、粳亞種的獨立多起源假說,并恢復使用秈 (Oryza sativa subsp. xian)、粳(Oryza sativa subsp. geng)亞種的正確命名。
據(jù)韋朝春透露,因為命名問題,《自然》編輯及文章審稿人曾多次和研究團隊溝通,起初并不認可這種修正。“但黎志康老師堅持要把之前的誤導性命名改過來,最終說服了對方。”
研究團隊認為,正確命名使得中國源遠流長的稻作文化得到正確認識和傳承。