百度AI:深海巨舰加速史

  • 来源: 驱动号 作者: 银杏财经   2021-01-11/09:16

  • 撰文\ 蓝山

    编辑\ 吴不知

    【图片来源于网络】


    这是银杏财经第342篇原创文章

     


    当我们提及“人工智能”时,到底在谈论些什么?


    是1956年的夏天,达特茅斯种下了“用人工智能改变世界”的种子,还是深度学习的技术突破推动AI大爆发,抑或是人工智能首次被写入政府工作报告,中国的人工智能在应用侧取得了一点微不足道的优势?


    由于工作原因,我可能会在各种场合与各色人等聊到“人工智能”,他们职业不同、年龄与价值观各异,正因如此,每一次对话都会走向各说各话的极端,很难达成共识。


    这也是当下围绕“人工智能”讨论的一个缩影,它看起来离我们很远,又仿佛无处不在。


    这给了我新的启发:不纯粹探讨技术,而是把人工智能的各项技术突破作为一个新变量,重新去审视AI对不同行业的影响和改变。

     

    1

    AI改变普通人的生活

     

    1998年,拉里·佩奇利用PageRank算法,建立Google。


    两年后,李彦宏用超链分析专利,孵化百度。


    后来的故事大家都知道,前者是全球用户访问量最多的网站,而后者,则成为世界上最大的中文搜索引擎。在中国,百度是为数不多的能够把一个专有名词变成动词的公司之一。


    2010年以前,百度的技术迭代主要围绕“搜索框”进行,转变发生在2009年8月。


    李彦宏在当年的百度技术创新大会上提出“框计算”的概念,一言以蔽之,就是对通过用户提交的需求进行语义分析、行为分析、人机交互和海量计算处理之后,将搜索与服务对接。


    这是百度上市之后最受关注的概念,也是智能搜索的雏形。


    万亿网页、百亿图像视频和定位数据、以及每年产生的数十亿次搜索需求、近十亿用户画像,是人工智能算法最好的养料。


    这也是为什么AI最先应用在搜索公司的原因,在国外是谷歌,国内则是百度。


    搜索之外,再没有一家公司可以拿出万亿参数和千亿样本。


    我们可以用一个小小的指标来衡量AI在搜索中的价值:在刚刚过去的2020年,得益于AI的技术加持,百度搜索结果的首条满足率提升到58%,而这个数据在三年前是16%,两年前涨到37%,一年前迈过了50%的关口。


    二十年前搜索就是一个框,二十年后依旧如此,只不过,这个框链接的内容已大不相同。


    有了语音合成技术,信息流就可以进化到看听模式,用户在不方便看新闻的时候听AI 读新闻;知识图谱和自然语言处理的应用,可以帮助用户更高效地找到所需信息;而我们熟悉的垃圾分类小程序,是在图像识别的基础上,对多种垃圾进行快速分类。


    就像谷歌的AI技术早已深入到Youtube的方方面面一样,在百度,这种融合也不再局限于移动生态。


    由个人云服务衍生而来的百度网盘离不开AI,百度地图90%以上的数据生产环节离不开AI,百度输入法要想在流量峰值期间提供不卡顿、不出错的语音输入服务,同样离不开AI。


    不止于此,当你吃着小龙虾看电视,想要换台却发现满手油不好操作遥控器;周末收拾家务时想放首歌,还得先放下手中的活再洗个手擦干……


    现在,这一切都有了新的解决方案,AI让机器学着理解人的指令,只要动动嘴,开灯、开空调、煮饭、放歌、调节目,都能实现。




    当然前提是,你家的电器得支持智能家庭的入口连接,这个入口或手机,或音箱,也有人说电视(不过我不是很认同,毕竟到目前为止,我没见过谁家电视是24小时连轴转的)。


    作为门槛最低的入口,智能音箱全球出货量TOP5的名单里,百度和谷歌赫然在列,还有就是亚马逊、阿里和小米。


    再把使用场景向外延伸,视觉语义化技术让无人零售成为可能。把想要的商品拿起来扫码,放进购物车,然后“刷脸”支付,就完成了整个购物过程,省去绝大多数排队买单的困扰。


    事实上,不仅是零售可以刷脸,就连机场,也为常用旅客开辟了人脸识别的快速通道。


    但凡近两年到访过宝安机场的朋友都会对快速通道印象深刻,隐形的变化是机场分配机位用上了AI算法,飞深圳几乎不用担心遇到摆渡车大魔王了,因为廊桥停靠率极大提高。


    就算你没在机场刷过脸,便利店里无处不在的刷脸支付总是有机会接触到的。


    在AI这条路上,过去半个多世纪都在“理论派”与“技术流”的质疑声中踽踽前行,没有应用场景的人工智能,面前突然就有了一个五彩斑斓的世界。


    从2017年6月的“Early Rider”开始,到2019年9月的首次无人驾驶,不管是在加州还是在中国,能真正提供没有安全驾驶员Robotaxi服务的,一是Waymo,二是Apollo。


    我们可以清晰地感受到,机器正在变得越来越聪明。

     

    2

    产业的智能化发展趋势

     

    就像搜索引擎的核心某个时间段被称为大数据,某个时间段被称为云,最终却又回到人工智能一样,驱动工业革命的技术通常具有很强的通用性,一如八年前的“互联网+”,以及现在的“AI+”。


    前者主导了长达十数年的信息化和数字化进程,而后者,开启了智能化的新篇章。


    2017年,中国有500个以上的城市和地区明确提出“智慧城市”的建设,批准了大大小小3000个以上的智慧城市项目,但实际上,这些项目大多和AI没什么关系,他们更像是一套糅合了城市交通、水利、建筑等数据的可视化系统,与“智慧”的关系并不大。


    要知道,即使按照最广义的定义,2017年AI在应用侧也就处于刚起步的水平,本质上来说,上一轮的智慧城市建设还是叫“信息城市”更合适。


    但这实在不能怪顶层设计,主要是IBM在设计“智慧星球”之初就存了把过剩的企业IT基础设施卖给政府的小九九。


    直到2018年下半年,AI与城市的结合才开始提上日程,最先是一小片街区的红绿灯改造。虽然AI控制红绿灯只是一个单点,但如果能够把通行效率提升15%~30%,就能为GDP贡献2.4%~4.8%的绝对增长。


    再然后是地方气象局与企业联合打造的AI+气象系统,通过深度学习提升短时间内气象预报准确率,今年我们看到西南地区一些气象地址灾害几分钟之内完成了快速预警,就是百度和重庆气象局的合作项目。


    虽然今天的智慧城市和电影里的未来空间相去甚远,但因为AI的参与,城市里已经开始出现用机器代替人工的趋势,不管是苏州用机器视觉摄像头监控水道污染,还是宁波用AI识别违章停车、乱堆物料、违规经营,抑或是消防系统通过AI摄像头与消防报警设备结合,预判火灾情形,都是如此。


    封城、隔离、封闭管理,2020年突如其来的“战时状态”,冲在一线的不只是不畏生死的“白衣天使”,还有在后方提供支持的AI技术团队:


    • 疫情期间,百度地图推出迁徙大数据平台、实时路况平台,随后及时上线发热门诊地图、疫情小区地图、核酸检测机构查询、复工地图等多项功能,为公众出行、社区防疫、政府决策等多方面提供指导;

    • 阿里云向全球免费开放AI算力,用于支持机构病毒基因测序、新药研发、蛋白筛选等工作;

    • 为了给居民提供出行的电子凭证,微信和支付宝上线“防疫健康码”;

    • 为解决机场、火车站、客运站等人员流量场所的测温问题,百度推出AI测温系统,并解决了因佩戴口罩及帽子造成的面部识别特征较少的问题;

    • 为了打通供应方与需求方的供应链缺口,京东成立了“应急资源信息发布平台”,向政府、企业和公益组织免费开放;

    • 百度开源的线性时间算法 Linearfold,将病毒全基因组二级结构预测从55分钟缩短至27秒,这意味着我们能更快地预测病毒变化趋势,提高疫苗研发效率……


    AI在大考之中的表现,让外界看到了AI落地的价值和产业智能化的希望。


    疫情后的复工复产,百度凭借“ACE交通引擎”在全国各地收获着智能交通的订单,银川、长沙、北京、保定,最快时一日三单,8月更是拿下了广州4.6亿智能交通大项目。


    而阿里、腾讯、京东和华为,今年在智慧城市上的收获,也明显比往年上了一个档次。


    很多属于城市的问题,本质上还是工业的问题,比如发电。在这些系统中,已经开始运用工业模型预测和AI质检能力,百度和国家电网、南方电网合作的无人机巡检项目,要负责两条中国特高压线路、150个以上变电站以及4万多输电线路的监拍,累计发现隐患2000余处、每天代替人工巡视能源线路超过7万公里。


    而巡检机器人一旦有了AI加成,设备仪表识别准确率就会提升到90%以上,人工巡检工作量降低90%。




    负责给巡检机器人加成的底层技术来自飞桨深度学习开源平台。飞桨之前,开源的人工智能操作系统有Facebook的 Pytorch、Google的TensorFlow,无一例外,都是来自大洋彼岸的科技巨头。


    在去年年末进行的IDC中国智能开发者调研中,有超7成受访者使用开源的深度学习框架,自己训练算法模型。


    按照IDC最新公布的数据,在中国深度学习平台市场综合份额中,Google、百度、Facebook稳居前三,占据70%以上市场份额。相比去年,百度的排名又上升了一位,份额与位列第一的Google相差无几。


    在中国的to B市场,百度大概是想做AI领域的Andriod,DuerOS之于智能家居、Apollo之于智能汽车,就是实证。


    前者控制了超过了1.7亿设备、500个以上的品牌和60个多个品类的IoT智能家居设备,而后者,则和60余个汽车品牌的300多款车型达成了合作。


    3

    与新基建共舞,是AI发展的必修课

     

    技术是冰冷的,它诞生在日复一日的冷板凳里。


    不管是阿里云还是百度AI,都经历了漫长的爬坡期。


    2020年是全球经济被动刹车的一年,也是新基建加速落地的一年,按照IMF的预测,中国是主要经济体中唯一实现正增长的国家,在复工复产的大背景下,AI被定义为新基建的基础设施与社会智能化的关键支撑。


    在“十四五规划建议”中,“科技”一词一共出现了36次,是绝对的高频词汇,而在列举出的前沿科技中,人工智能、量子信息和集成电路被放在前三位。


    上一个在国家级战略规划中获得如此重视的领域是“互联网+”。从2015年开始,连续四年,“互联网+”从未在政府工作报告中缺席,与此同时,互联网在零售、物流和工业品领域的应用越来越广泛,和教育、文化等领域的融合也进入到初级阶段。


    按照中国电子信息产业发展研究院的预测,我国人工智能市场将保持30%左右的增长速度,到2021年人工智能市场规模将突破800亿元。


    稍微了解下基建在中国经济增长中的比重,就不难理解“新基建”酝酿出的庞大市场。


    相比于兜售存储、计算、CDN等资源,人工智能让云计算有了解决场景化问题的可能,于是巨头们纷纷开始提出云计算与AI融合的构想:


    百度是最早把云计算和AI结合在一起的公司,随后阿里云确立了“云计算+IoT+人工智能”的方向,华为云提出了“普惠AI”的概念,腾讯则推出了AI即服务的相关产品。


    我们都知道,人工智能,先有人工,再有智能。


    早期的云和AI是相互独立的,而AI应用想要落地,首先要完成数据的收集工作、对数据进行标注,然后是数据处理并选择对应的算法模型,再对模型进行训练和优化后,最后试着在实际场景里跑一跑。


    这个过程需要耗费大量的人力物力和时间,且没有捷径可走。


    巨头尚有余力,可对普通开发者来说,这太不经济了。EasyDL能够做到让非人工智能领域的人通过页面拖拽操作和少量数据上传,训练出定制化AI模型的开发平台,有数据显示,这是市面上用户认知度最高、受访者使用频率最高的机器学习平台。


    半个月前的百度云智峰会,官方向外界披露了一组数据:百度智能云AI Cloud的活跃客户数同比增长65%;百度智能云对外开放的AI能力已经有270多项,服务了260多万开发者,日均调用量超过1万亿次。


    在Gartner的最新报告中,腾讯云是TOP云厂商中增速最快的一个,而以AWS为首的3A阵营,市场份额出现些许变动的迹象。这一点,从一些细分领域就可以得到验证:2020上半年中国的AI公有云服务市场,算是最近的例子。




    在新基建的赛道上,作为基础设施的数据中心显得尤为关键。百度最大的数据中心在山西阳泉,是国内首个服务器规模突破10万台的单体数据中心,而阿里云,去年刚刚建成了全国最大的数据中心集群,至于腾讯,也宣布要在未来5年投资5000亿元布局新基建。


    4

    结语


     

    在赛博朋克的世界里,科技与人文似乎总是水火不容。


    百度是最早将人工智能技术用于寻人的企业,截至2020年12月,用户在“百度AI寻人”平台发起的照片比对已超过39万次,11934个家庭得以重新团聚。


    后来有越来越多的企业开始把AI用于社会公益事业,包括长城的修复工程以及敦煌壁画的数字采集工作。


    这是当代人工智能产业落地最真实的样子,也许算法在开源数据中跑出不错的结果,平移到真实场景之后,还是会出现偏差和错误。


    但人工智能从兴起到幻象、再到回归本质,那些一点一滴改变着产业智能化的革新者,总会迎来黎明前的第一丝曙光。


    我们总是倾向于认为技术创新源自某位天才的灵光乍现,但当我们把时间拉长,很容易就会发现这是一个漫长的过程,很可能需要数十年乃至上百年的光阴才行。


    评论 {{userinfo.comments}}

    {{money}}

    {{question.question}}

    A {{question.A}}
    B {{question.B}}
    C {{question.C}}
    D {{question.D}}
    提交
    文章数: {{userinfo.count}}
    访问量: {{userinfo.zongrenqi}}

    驱动号 更多