• 2019年3月11日 15:21

    1. 摩尔定律早已结束
    目前,提高并发性是解决人类计算能力的主要方向了。但是并发的编程模型一直受到来自上下两方的压力。
    2000年开始之际,人们已经意识到摩尔定律失效了。你不太可能期待着今年写的C代码在明年的时候能够被更快的处理器运行了。因为处理器性能的提升主要是通过堆积更多的core来完成。所以为了编写更快的代码,你要做的是编写并发式的程序,同时使用更多的核、更多的CPU、更多的机器。对于并发式的编程模型这就是来自于下方的压力。

    当今的主流商业应用软件都是跑在web端的,7乘24小时百万级以上的并发访问。人们已经无法想象一个运行在桌面的单机程序实现同样的商业价值。对于编程模型来说,这是来自于上方的压力。所以当我们谈论区块链时,我们需要明白支持并发性才能满足市场的需求。

    2. 线程模型并不理想
    线程模型是上世纪90年代提出的并发模型,线程模型广泛应用在Java虚拟机、CLR、.net虚拟机中,甚至应用于Erlang这样更高级的系统。线程模型失败的地方在于如果你在读一段Java或C sharp代码,你无法明白有多少个线程在里面。

    我们可以讨论并行性和并发性,也可以讨论并发式和分步式,前提是我们必须搞清这几个概念。并行性指同步进行的多项活动之间并不共享信息。就像一条八车道的公路,根本没有换道,那就是并行。当你开始允许换道时,不同的活动和线程之间出现交互,那就是并发。分布式就是把每一笔交易想像成一辆车,换道就是切换到不同的处理器上。分布式必然需要面对故障模式,如果允许单独某个任务失败,就带来了本地(local)的概念。
    线程有不同的概念,包括有操作系统线程和cpu内核的物理线程等等。我谈论的是虚拟机上提供并发性的编程模型。线程模型的问题是本质上在编程语言的语义层面并没有提供并发性的支持。
    我用语言集成查询作为一个例子,证明语言集成将最终胜出。语言集成查询开始于微软的函数式编程大牛Eric Meyer。数据存储的两个方法是:1,提供一个支持数据存储的库;2,提供一个查询的语言特性。在第一种情况下,并没有类型系统(type system)帮助你对查询进行语义检查。在后一种情况下,类型系统和编译器参与检查确保查询处于良好状态并且不会中断。在过去的十五年中,语言集成查询已经是最热门的话题之一。所以时间将会证明,语言整合的方法会稳步胜出。
    回到并发的话题,采用库的方法就是线程模式的思路。在语义层面的扩展就是Rholang、 Pict 或者Vim等移动进程演算(mobile process calculi )的思路。type system保证了你在读一段Rholang程序时,能够看到有多少个进程在进行。同样的,如果你采用 pi calculus 或者 ambient calculus也可以具有同样的优势。

    3. DAO事件其实是一个并发问题
    并发性成为一种语法现象。因为它是语法,是可以对代码进行分析并检查各种并发属性的语法。一个非常好的示例是竞争条件(race condition):两个事件是否有可能以任意顺序发生?
    DAO事件其实是一个并发问题,是竞争条件。如果有对应的语言表示,就可以通过语法分析(也称为静态分析),捕获这些错误。即使是熟悉并发问题的老程序员,仍然会不时地搞错,例如用餐哲学家(dining philosophers)或其他类型的问题,所在为并发编写算法是非常困难的。当我在八十年代末和九十年代初期在Rosette工作时,我注意到即使使用非常强大的编程语言,并发编程也是非常困难的事情。不幸的是编程理论停止了二三十年,市场好像卡住了。我惊诧于Javascript一直统治着浏览器平台。我计划开发一个基于Rholang的浏览器语言,使用Rholang从头编写浏览器。

    4.现在的区块链都错了
    大多数交易是孤立不相关的。大多数人的财务状况都是彼此分开的。当你去喝咖啡时,地球另一面的人在买菜,你们的交易不相关,在区块链世界中,这一点非常重要。如果我们必须对这些交易进行系列化,我们就走进了死胡同。所有的交易都必须经过一个虚拟机。如果那个虚拟机是顺序的(sequential),Transaction将不得不按线性排列,这正是以太坊虚拟机的模式。在这种情况下,无论是DAG还是区块,那都无所谓了。在区块链上使用序列化模型时,不可能有语言层面的并发的显式表示。因此无法使用静态分析来获得并发行为,并发都隐藏在幕后。这就像一个干净和纯粹的函数式语言和Java之间的区别。使用与lambda演算接近的函数式语言,你所看到的就是你所获得的。所有执行实际上都在代码中。而对于Java来说,程序中存在着一堆隐藏的状态:堆栈、线程数以及类似的东西都在代码中。
    举一个死锁的例子(Deadly embraces):程序A只有在收到程序B的消息时才能发出另一个消息给程序B;而程序B也是只有在收到程序A的消息时才能发出另一个消息给程序A。这形成了一种相互依赖关系,变成了一个循环检测(cycle detection),所以就卡住了。类型代表依赖,你可以从类型中提取出这些内容。但重要的是,既然我们知道所有这些不足,我们就不应该在区块链中使用这样的计算模型,它不一定是Rholang,但它不应该是顺序的(sequential)。

    5. WASM会被淘汰
    所以在区块链的世界里,WASM会出局,因为WASM缺少一个像样的并发模型,虽然它尝试处理并发,但基本上还是顺序的。更重要的是,它不能在代码中使并发显式化。所有类似的映射到成熟虚拟机(如LLVM)的方法本质上不是虚拟机,而是一组库,它不解决并发性。当人们尝试在LLVM上执行任何类型的并发时,都会如同恶梦一般。

    6. Rholang是最佳的并发方案
    任何类型的分片(sharding)机制都必须基于某种命名空间(namespace)技术。为了将一条消息发送到另一个分片,你需要某种命名机制,它被称为URI。因为分割命名空间的方式和并发结构之间存在直接关系,分配单元不符合并发性。所以分布式pi演算方法中最大的缺陷就是无法在并发结构和失败区域结构之间取得良好的一致性。
    Rho演算解决了这个问题。因为名称和流程之间的联系。命名空间内置了区域的自然概念,区域的概念对应于各种情况的并发结构。

    blog.rchain.coop/blog/2019/03/08/rcast-21-the-currency-of-concurrency/
    文章翻译自Greg Meredith的访谈,愁虫编译。转帖需注册出处:Rholang中国(rholang-china.org/)

  • arrow_forward

    主题帖已经被从版块新手问题中移动