返回

第一百五十一章 深蓝存储(4000字)

首页
关灯
护眼
字:
上一页 回目录 下一章 进书架
作为信息载体,与传统的存储介质相比具有许多优势。

    其高存储密度、潜在的低维护成本等优良特性使其成为信息存储的理想替代品”

    “介质存储信息的能力我们用香农信息指数来衡量,由于dna分子是由脱氧核糖核苷酸单体的线性链组成的异质聚合物。

    每个单体采用四种碱基a、t、c和g中的一种,特定排列(即序列)提供了一定量的信息。

    根据香农信息的定义,单个碱基所能容纳的最大自我信息量(h    )为......

    自我信息对碱基分布的依赖性在表1中给出,其中a是“概率分布偏差”,即碱基出现的频率与    0.25    的平均频率之间的差异。”

    “对于dna分子来说,如果四个碱基中的每一个都与自身完全对应,那么h    (x|y)=0,i    (x;y)=2bit/碱基,传输中的平均互信息等于源熵,它给出了传输信息量的上限。

    但是,在写入和读取dna序列的过程中,信息可能会发生扭曲,导致输入集x和输出集y不匹配,从而降低了传输过程中的平均互信息。例如,如果每个碱基对应于除自身以外的其他三个碱基的概率为    1/10。

    碱基读数的失真大大降低了    dna    中信息传输的效用。

    不同传输错误率mi下的平均交互信息(一个碱基被错误地读出为其他三个碱基之一的概率),假设    2    位/碱基输入。平均互信息随输入基础偏差和传输错误率存在一定的关联性。

    我们可以通过某种手段来规避这种错误,完美的发挥dna分子应有的存储效率。”

    “在dna中增加存储数据的纠错码。通过存储模型,其中数据集由一组无序的    m    序列表示,每个序列的长度为    l。该模型中的错误是整个序列的丢失和序列内的点错误,例如插入、删除和替换。

    我们在此存储模型中推导出纠错码的可实现基数的    gilbert-varshamov    下界和球体上界。

    进一步提出了明确的代码结构,以纠正这种可以有效编码和解码的存储系统中的错误。”

    (上面写的很简单,这是根据《national    science    review》2020年第7卷的某一期里面关于dna存储技术的一篇综述改编的,主要做了简化处理。)

    生物存储技术的本质其实就是利用dna存在四类不同碱基的特性,利用这根链条来存储信息。

    蓝星自主研发的实验室产物,听上去很美好,但是有很多的问题。

    其中最大的问题在于信息的读取和写入,读取还好一点,信息写入dna分子里相当复杂,这种设备又贵又不好用,普通人你让他往dna分子里写信息,至少得培训几个月吧。

    别人用个dna存储还得培训几个月,那我不如用硬盘。

    梅林给的生物存储技术是可以直接落地大规模商用的产品。

    更重要的一点在于,梅林在技术资料里,给了魔法从微观层面影响物质的实现路径,科学家们认识到这才是最有价值的。

    华国和俄国联合成立了研发团队,需要在第一时间把生物存储技术在现实中复现出来的同时,对魔法影响微观世界这一课题展开研究。

    梅林提供的生物存储技术,在经过专家评估后,里面关键的步骤需要用到魔法。

    因此研发团队就不用对保密性要求那么高,关键信息进行保密即可。

    当然该签的保密协议还是要签。

    其中如何实现dna分子信息的读取和写入,如何避免出现错误写入。

    这里要用到某种全新的材料。

    而这种全新材料的制作设备,在关键组件上需要法师从微观层面依靠意志进行约束。

    因此只要把这一步卡死,没有法术模型和实现路径,别人就算拿到了其他所有技术也没用。

    你生产不了这种材料也是白搭。

    ......

    4月华国和俄国共同成立的深蓝存储有限公司挂牌,直接由长江存储调高管前去任职。

    本来华国想取名为鲲鹏存储的,但是这个名字已经被花为先用了,而且考虑到有俄国参与其中,用华国古典神话中的动物也不太好。

    最后大家折中,取名为深蓝存储。

    
上一页 回目录 下一章 存书签