【身为法师的我只想追求真理】小说免费阅读,请收藏 全本免费小说【qbmfxs.com】
“对于DNA分子来说,如果四个碱基中的每一个都与自身完全对应,那么H (X|Y)=0,I (X;Y)=2bit/碱基,传输中的平均互信息等于源熵,它给出了传输信息量的上限。
但是,在写入和读取DNA序列的过程中,信息可能会发生扭曲,导致输入集X和输出集Y不匹配,从而降低了传输过程中的平均互信息。例如,如果每个碱基对应于除自身以外的其他三个碱基的概率为 1/10。
碱基读数的失真大大降低了 DNA 中信息传输的效用。
不同传输错误率mi下的平均交互信息(一个碱基被错误地读出为其他三个碱基之一的概率),假设 2 位/碱基输入。平均互信息随输入基础偏差和传输错误率存在一定的关联性。
我们可以通过某种手段来规避这种错误,完美的发挥DNA分子应有的存储效率。”
“在DNA中增加存储数据的纠错码。通过存储模型,其中数据集由一组无序的 M 序列表示,每个序列的长度为 L。该模型中的错误是整个序列的丢失和序列内的点错误,例如插入、删除和替换。
我们在此存储模型中推导出纠错码的可实现基数的 Gilbert-Varshamov 下界和球体上界。
进一步提出了明确的代码结构,以纠正这种可以有效编码和解码的存储系统中的错误。”
(上面写的很简单,这是根据《National Sce Review》2020年第7卷的某一期里面关于DNA存储技术的一篇综述改编的,主要做了简化处理。)
生物存储技术的本质其实就是利用DNA存在四类不同碱基的特性,利用这根链条来存储信息。
蓝星自主研发的实验室产物,听上去很美好,但是有很多的问题。
其中最大的问题在于信息的读取和写入,读取还好一点,信息写入DNA分子里相当复杂,这种设备又贵又不好用,普通人你让他往DNA分子里写信息,至少得培训几个月吧。
别人用个DNA存储还得培训几个月,那我不如用硬盘。
梅林给的生物存储技术是可以直接落地大规模商用的产品。
本章未完,点击[下一页]继续阅读-->>