我們找到了基因調控語法的羅塞塔石碑

早在1975年,生物學家就發現黑猩猩和人類的基因組有99%以上是相同的,但是,直接看的話,黑猩猩和人類明顯不一樣。

為什么?

答案在于,DNA更像是一種編程語言中的函式,大多數生物加載的是同一套函式包,但是呼叫方法和具體的輸入引數是不同的。它們可以隨著時間的推移而打開或關閉,可以向上或向下繼承,并以復雜的方式相互作用。一些基因編碼產生特定蛋白質的指令,而另一些基因編碼調節其他基因傳遞的指令。

現在,生物學和生物物理學教授羅伯特菲利普斯的實驗室已經開發了一種新的工具來確定普通細菌中各種基因的調節模式。

雖然大腸桿菌幾十年來一直被用作生物學和生物工程中的模式生物,但研究人員只知道大約35%的基因調節功能。菲利普斯實驗室闡明了近100個以前未被表征的基因是如何被調節的,并為解碼其他基因奠定了基礎,

關于新技術的論文發表在eLife上。

想象一下,我們試圖學習一門新的語言,但我們不能理解一個單詞的含義或語法規則,即使新語言中的每個單詞都由26個英文字母組成,這類似于現代基因組學時代生物學家面臨的挑戰:生物基因組測序快速直接,但實際上我們并不太了解每個基因的功能和調控方式,這部分無疑是最重要的,如果我們理解了新語言的含義和語法,我們可以試著寫自己的句子,

菲利普斯說:“我們開發了通用工具,研究人員可以在幾乎任何微生物上使用,”

本質上,“排印錯誤”也出現在基因組中,所以我們可以觀察錯誤對細胞功能的影響。如果把單詞“walk”中的字母“k”換成字母“x”得到“walk x”,因為新單詞沒有意義,所以無法表達,這樣就可以把未表達的字符與基因“walk”的功能聯系起來。但如果把字母“w”換成“t”,得到有意義的“talk”,情況就復雜了。

菲利普斯實驗室開發的工具本質上是通過上述替代,一個一個地闡明基因組與被調控性狀之間的直接關系。

在實驗中,菲利普斯和他的同事首先測驗了20個特定大腸桿菌基因——的開啟和關閉,它們的功能早已為人所知。他們的方法正確地描述了這20個基因的特征,接下來,實驗小組繼續分析另外80個未知基因,

目前這種方法只適用于細菌細胞,但Phillips認為可以升級,最終應用于更復雜的真核細胞(如人類細胞),

“這是一個被NIH先鋒獎表彰的長達10年的科研專案,需要不斷的努力和資金,這需要耐心,而不是短期的結果。”

https://phys.org/news/2020-10-genomic-rosetta-stone-gene.html

8 条回复 A文章作者 M管理員
  1. @Ar: PHP是最好的語言.jpg

  2. 現在這個還屬于在研究匯編指令階段,還要再等等C語言出來

  3. @Aule: 從頭寫起可能還不如屎山,要人工插入無效片段才能保證一定時間內自然突變不影響代碼運行,要不兩三代就藍屏生不出來了。

  4. @Aule:

    這說法我也認同
    但主流(也許一部分)科學家總認為那些junk基因是有用的,之前牛津大學部的研究成果好像jandan也有翻譯過,就是科學家找到了junk基因是調控表達的關鍵……然后就沒有然后了。

    好奇主流科學界,現在到底在對那部分“junk genes”怎么看

  5. 基因組其實就是一座40億年祖傳屎山,大部分垃圾DNA就是隨便瞎建了個變數又沒用,偶爾修改垃圾DNA有改變就是這個變數后面又真的用了。感覺像人類基因組這種復雜程度的屎山,有生之年人類可及的算力想完全讀清楚還真是難度不小。我覺得還不如從頭寫起另起爐灶來得快

  6. 可以在這方面使用自動化實驗模式,甚至讓計算機自己總結、設計一些實驗方向吧?感覺各種操作上會有非常非常多的重復環節(實驗室大哥別打我)

  7. 如果上帝是老程式員,只希望他不是Java程式員

  8. 這么說,上帝是老程式員了?