6月12日上午,中国软交会在大连举行的第一天,在主题为“软件定义智能新时代”的高峰论坛上,中国工程院院士、北京大学信息与工程科学部主任高文带来了“人工智能开源平台与社区”的精彩演讲,并对上述两个问题进行了解答。
中国工程院院士、北京大学信息与工程科学部主任高文
高文表示,目前有四个瓶颈,为了解决我们规划了一件事,具体这件事怎么做、对未来有什么影响,将从下面这四个方向与大家共同探讨。
人工智能的四大瓶颈
一、系统之间难迁移
现在人工智能发展起点并不高,反而很低。
目前的人工智能系统,有很多开源的东西拿来就可以用。很多大公司都在提供,外国企业比如微软、亚马逊,国内企业比如百度等等。
这些系统对于中小企业或者对于一些个人问题的解决是非常有帮助的,可一旦你使用了其中之一的系统,想把自己的东西简单迁移到其他系统上的时候,两个不同的系统之间在模型、协同方面进行简单迁移并不容易,可能会形成一些事实上算法的孤岛。
二、硬件之间难适配
现在人工智能通常需要一个大的训练平台,你可以自己在网上搭建,也可以通过以上提及的大的开源公司来搭建。
但是一旦用它们的平台训练完成,训练出来的模型对它这个平台选定的硬件效率会比较高,甚至极高。
但若不是它这个平台推荐的硬件呢?效率就不会这么高了。
这就产生一个问题,可能有一些厂家或者团队觉得:“我觉得亚马逊的好用,我就用亚马逊训练。”但是往往训练完成之后才发现,这个平台很可能会推荐你使用某某系统,恰好是厂家或者团队不熟悉的,可能厂家和团队熟悉的是另外一家的平台和系统,但是和硬件不相关的训练实际上是有区别的,所以和硬件之间实配的问题是现在发展的一个瓶颈。
三、推广自由受约束
第三个瓶颈实际上是应用,现在很多应用,特别是已经存在的一些与工业关联的应用一般由厂商自己组织,甚至自己去找一些软件或者是硬件厂商帮它做,有的当然是自己开发。
如果你用刚才所说的这种开源人工智能平台,自由度就会大大受限,可能要用其指定的硬件平台。
如果你原来可以自由的推广,一个方案可以在不同的领域实施,那么现在却要捆绑一些平台的东西,所以推广的自由度会受到约束。
四、国内硬件难发展
目前所有能自由采用的开源平台都非常好。
开源系统装上服务器后,确实能对你提供的数据进行训练,形成一些训练好的模型。
比如google建议用google的TPU;有的平台建议用英特尔某一款芯片;IBM也有自己的人工智能的芯片。
基本上绑定的这些硬件大多是国外比较成熟的一些厂商提供的产品,这对国内想做芯片的厂商就带来一定打击。可以说是输在起跑线上了。
这个问题使得国内硬件的发展可能会有一些瓶颈。
如何解决问题?
一,解决思路及办法
为了解决这个问题,国家工程院携科技部向国家高层提出了一个咨询建议,最后这个咨询建议成为科技部的重大科技专项,并专门讨论了关于人工智能平台的问题。
为了解决问题,我们设计了一个新的平台:对原有的平台并不排它,全盘照收;增加一层基础平台,可嫁接原有的东西;在中间加转换层,使得硬件和平台不相互对应和依赖。如此这般,一个转换就可以使A平台训练的东西照样可以用B的硬件去实现,而且对硬件的支持将来会用一个人工智能开源的标准去规范,现有的芯片和将来国内厂商开发的芯片只要按照标准做,都能与以上提及的平台对应起来。
这样,一个新的平台就可以应对上面的瓶颈问题了。
二、新平台建在何方
平台到底建在哪里?由谁出钱做?
目前,广东省深圳市愿意出钱建一个这样的平台,我们起名叫做“深圳云脑”,这完全是一个公益性的项目,任何钱都赚不了,只是给国内做研究开发和做产业化的公司及团队提供支持。
“深圳云脑”的体系架构底层是各种各样的硬件平台,硬件平台上面是操作系统,操作系统再上面是重大应用,操作系统又包括云脑操作系统和云脑大数据管理系统。
三、开源联盟重要性
我们设计了一个开源组织、开源社区,通过这个联盟整体把人工智能开源平台这件事组织好,让大家都在高起点上起跑。这个联盟我们称之为“一体两翼”,一体就是人工智能产业联盟,一个翼是开源平台,另外一个翼和知识产权、标准、融资等等相关的配套措施。
人工智能现在发展一个很重要的事是“哪些事情不能做”。
因为是开源平台,专门用了一个许可证,启智开源许可证原则,它是完全免费且完全开放的,也是尊重创新的。不能说完全没有约束,其目的最终还是为了让大家进行自我约束。
目前很多国内外企业以及高校机构都有意向加入。如果能推进下去,相信应该对我国人工智能的发展有一定的借鉴。