百度喻友平构建AI生态钱对于我们不是第一位的

前不久市场调研公司 Canalys 公布全球智能音箱市场报告,百度位列全球第三位(此前一季度是第二位),与第二位的差距非常小,而且是前五位中增长最快的厂商,可谓异军突起。

一是大力推进信息化智能化建设。继续深化国家信访信息系统功能应用,做到前台受理办理与后台督查分析并重,网上及时督办、随时督办、精准督办,深入挖掘信访大数据资源,全面准确科学地综合分析研判信访形势和问题,把信访信息系统各项功能用足用好用到位,实现全流程提质增效。及时完善系统模块功能、提升网络速度,使网上信访更加便捷畅通、权威管用,让民众爱用好用。加快推进信访业务智能辅助系统建设应用,各地要借鉴试点单位的经验,尽快落实立项和建设应用,助推信访信息系统全面升级,以智能化促进信访业务规范化标准化。工作中,要特别处理好新技术与“老办法”的关系,注重网上受理和网下办理相结合,充分发挥党的群众工作优势,每件信访事项都要做到网上及时回应、网下面对面沟通,避免在“网对网”“键对键”中造成解决民众诉求“空对空”。

喻友平认为,“不可能每个企业每个管理者和做技术的人都能从这个层面上去理解它,然后再去想我企业能够干什么,那这个弯就绕得有点远了。”AI 界一直有个讨论是,在 AI 赋能传统行业的过程中,由于行业的隔阂,科技企业和传统企业谁需要更多的努力去了解对方。显然,AI 公司也需要付出很大的努力。

百度是国内最早确立 All In AI 战略的大公司,而百度 AI 战略的重要组成部分,就是其 AI 生态,这是构建护城河的关键。

无独有偶。宜通世纪也宣布拟向关联方出售深圳市倍泰健康测量分析技术有限公司(以下简称“倍泰健康”)。

这些成绩的取得,是百度的深厚技术积累加上 All In AI 的战略共同达成的,而同样不得不说的功臣,是背后的 150 万开发者生态。

下图对LaserTagger在句子合并中的应用进行了说明。

今年12月10日晚,宜通世纪宣布向珠海横琴玄元八号股权投资合伙企业(有限合伙)出售倍泰健康100%股权,交易对价为1.7亿元。为了完成转让,宜通世纪3名实控人童文伟、史亚洲及钟飞鹏出任纾困基金的有限合伙人,并以所持3400万股上市公司股票为这项交易提供担保。

那么百度是怎么做的呢?

百度本身自有场景非常多,所以一下子就开放了上百个百度内部打磨的模型,包括 PaddleSeg、PaddleNLP、PaddleRec 等等,每一个都是一个系列。这个领域里面掰开,里面又有一大堆的模型,而且百度开放的这些是已经经过打磨的模型。

对于许多文本生成任务,输入和输出之间存在高度重叠,LaserTagger正是利用了一点。例如,在检测和纠正语法错误或多个合并句子时,大多数输入文本可以保持不变,只需修改一小部分单词。然后,LaserTagger会生成一系列编辑操作,而非实际单词。 

东北证券研究总监付立春表示,上市公司资产高买低卖主要反映了资本市场并购重组过程仍存在不成熟、不规范的现象,一定程度说明上市公司自身质地也可能发生了重大变化,需要引起投资者足够重视。

 喻友平认为,AI 技术提供商要赚到钱,首先要让集成商和落地应用赚到钱,这才是一个良性的生态。

降低 AI 门槛是个系统工程

而帮助 AI 落地的一个重要媒介就是集成商,他们将核心的 AI 技术打包进产品和方案中,再提供给终端应用,可以大幅降低企业需要自己开发的难度。

喻友平表示,这一波 AI 的驱动力就是深度学习,而深度学习实际上是一个数学问题,是在数学原理上面往前推进了一步。它的应用主要就是图像、语音、自然语言处理以及大数据这四大领域。

雷锋网原创文章,。详情见转载须知。

目前百度这方面合作伙伴的规模超过 1 千家,各行各业、各个领域都有。从百度搭建的 AI 市场中产品、商家的丰富程度就可见一斑。

百度针对这块提出了“燎原计划”,目前已经进行了 3.0 阶段,主要内容包括三块:第一是帮助合作伙伴做出来;第二是卖出去;第三是帮他做得大。

图注:在100万个样本的完整数据集上训练模型时,LaserTagger和基于BERT的seq2seq基线成绩相当,但在10,000个或更少样本的子样本上进行训练时,LaserTagger明显优于基线模型(SARI得分越高越好)。

这四大领域再对应到企业的应用场景又有极多,为什么这些行业都会用?是因为本质上深度学习是从数据里面提炼知识的一种能力,而从数据里面去提炼知识本身就是一种预测能力。

在 2019 年 11 月 28 日举行的百度大脑语音能力引擎论坛上,百度大脑宣布语音能力引擎日均调用量已经超过 100 亿次,应用规模业界第一。

负责百度 AI 技术生态部的喻友平,其主要目标是推动百度 AI 技术和平台的生态繁荣,这个生态里包含开发者、集成商以及企业。

对于评估方法的差异,奥马电器认为,自2018年开始,互联网金融行业监管政策发生巨大变化,受行业监管政策影响,主营网贷相关业务的被评估单位中融金已连续亏损,行业局面不会在短期内得到改善或向好发展的情况下,截至评估基准日,未来收益和风险无法预测及不可量化,因此本次评估不适宜采用收益法。在国内流通市场的类似上市公司中没有在现金流、增长潜力和风险等方面相类似的公司,且无法收集近期市场交易对比价格,因此,本次评估不采用市场法,故采用资产基础法进行评估。

你想如果集成商要给我 1 块钱,他不挣到 10 块钱怎么会给我 1 块钱?我们也跟合作伙伴聊过,比如说你的单大概有多少钱?单里面大概愿意出多少钱来购买一个 AI 服务集成进去,大概都是 10% 的样子。所以我们说的“弱水三千,只取一瓢”的意思就是:一定是你的合作伙伴他挣到钱了,你才在里面再挣一点点钱。

二是全面推进让民众“最多访一次”。一方面,要抓住解决问题这一根本,围绕受理、转送、交办、督办、审核、回访等各个环节,简化工作流程,缩短办理时限,压实首办责任,完善联合接访机制,整合资源力量,最大限度提高办理效率。另一方面,不能满足于民众访一次办结,还要让民众满意,把推进让民众“最多访一次”与深化“人民满意窗口”创建活动紧密结合起来,用心用情接待民众来访,不断改善接待场所条件环境,让民众诉求只进一门、只访一次就能得到有效解决,让民众在信访部门感受到家的温暖,感受到信访工作的温度。

AI 是一把手工程,特别是对于传统行业来说,你不要想一个部门经理或者一个什么 VP 就能够搞定这个事情。真正让 AI 在整个业务里面能够起到变革性的或者说升级性的作用跟价值的,必须是一把手工程。所以说让一把手理解 AI,理解智能化,才是未来一个很关键的问题。

三是准确把握信访法治化要求。信访部门严格落实访诉分离要求,要甄别清、分离准,做好民众的解释说明和引导工作。深入推进依法分类处理,各级信访部门要加强协调推动,中央和国家机关要加强系统指导,确保分得开、分得准,接得住、办得好。要准确把握依法逐级走访要求,压实受理办理责任。严格规范复查复核工作,强化实体性审查,充分发挥监督纠错作用。今年是《信访条例》修订15周年,要完善信访法律法规体系,开展形式多样的宣传教育,尤其是加强法治宣传,进一步形成依法办事、依法维权的良好氛围。(完)

图注:LaserTagger预测的编辑操作中,删除“Turing”,添加“ and he ”。请注意,输入和输出文本存在的高度重叠。

Google团队最后写道:“ LaserTagger的优势在大规模应用时变得更加明显,例如,通过缩短响应时间并减少重复性,改进了某些服务中语音应答的格式。高推理速度使该模型可以插入现有技术堆栈中,而不会在用户端增加任何明显的延迟,而改进的数据效率可以收集多种语言的训练数据,从而使来自不同语言背景的用户受益。 ”

在此之前,Google已经发布了Meena,一个具有26亿个参数的神经网络,可处理多轮对话。1月初,Google在论文中还提出了Reformer模型,可处理所有小说。

EasyDL 百度最开始提出来的是,开发者一行代码都不用写,因为有一些领域,比如图像分类、物体检测、图像分割,这种东西的算法都已经非常成熟了,对开发者来说不用写算法,就把数据标好,把它传上去一点就有了,所以百度先在这个层面做了很多工作。后来百度又开始在 EasyDL 里面把 ERNIE 集成进去,把最好的数据集成进去,未来还会把 Paddle CV 的一些东西也集成进去。

Money 并不是第一位

雷锋网原创文章,。详情见转载须知。

因而在降低 AI 门槛方面,就需要从下面几个方面入手。

在平台层面,有些人希望从平台一些算力,不想自己去搞,所以百度有了 EasyDL、AI Studio,EasyDL是面向企业做企业开发的,AI Studio 是面向开发者或者教育领域的。

首先在应用层,部署方式要非常丰富,包括云、端、私有化、软硬结合、边;二是算法有很广泛的适应性,比如人脸这个场景,远一点,近一点,太阳光多一点,在不同的情形下面算法都是需要调整的,所以算法要有非常强的适应性,要有很多的版本、系列。

在开发层,百度有自己的框架飞桨,这个框架让开发更简单,易用性更高,例如说在网络搭建上面,有静态图、动态图,网络基本的开发工具上面都有。不过,只有一个空的架子去搭也很难,还需要足够多已经做好的模型。

所有添加的短语均来自受限制的词汇表。该词汇表是一个优化过程的结果,该优化过程具有两个目标:(1)最小化词汇表的大小和(2)最大化训练样本的数量,其中添加到目标文本的唯一必要单词仅来自词汇表。短语词汇量受限制会使输出决策的空间变小,并防止模型添加任意词,从而减轻了“幻觉”(雷锋网注:hallucination,模型在所生成的文本中,输入信息中并不存在)的问题。

百度基本上每个部门都有 MVVS,M 就是 Mission,V 就是 Vision、Value,S 是 Strategy。我们部门的 Mission 就是一句话,让 AI 技术的创新与应用更简单,这就是我们部门的 Mission。我们经常在讨论什么事情?如果有矛盾的时候,说把 Mission 请来,想想我们做的活跟我们的 Mission 是不是一致的。我们有没有让 AI 技术的应用跟创新更简单,如果是让它更简单我们就做,如果是反其道而行之的,那这就会有问题。

输入和输出文本的高重叠性的一个推论是,所需的修改往往是局部的并且彼此独立。这意味着编辑操作可以高精度地并行推理,与顺序执行推理的自回归seq2seq模型相比,可显著提高端到端的速度。

由此二者的需求也不一样,前者更多的是提供的丰富的实际应用,需要云、边、端的,满足不同情形下面的这些能力。第二个层次中,开发模型就需要一个框架,或者一个平台。

雷锋网注:百度 AI 市场网站截图

专家认为,上市公司资产高买低卖主要反映了资本市场并购重组过程仍存在不成熟、不规范的现象,一定程度说明上市公司自身质地也可能发生了重大变化,需要引起投资者足够重视。

控制:通过控制输出短语词汇(也可以手动编辑或整理),LaserTagger比seq2seq基线更不易产生“幻觉”问题。 推理速度:LaserTagger计算推理的速度比seq2seq基线快100倍,能够满足实际情况下的实时问题。 数据效率:即使仅使用几百或几千个训练样本进行训练,LaserTagger也会产生合理的输出。实验中,seq2seq基线需要成千上万个样本才能获得相同的性能。

研究人员评估了LaserTagger在四个任务中的表现,分别是:句子合并,拆分和改述,抽象总结和语法纠正。结果显示,使用大量训练样本情况下,LaserTagger与基于BERT的seq2seq基线成绩相当,并且在训练样本数量有限时明显优于基线。下面显示了WikiSplit数据集上的结果,其中的任务是将一个长句子改写为两个连贯的短句子。

近日,奥马电器披露了《关于出售全资子公司股权暨关联交易的公告》,拟作价2元出售全资子公司中融金(北京)科技有限公司(以下简称“中融金”),交易对手方为公司实际控制人赵国栋及其控制的企业权益宝(北京)科技有限公司。

但目前来说,“肯定不是 Money 为第一位的”,他对雷锋网说。

远场语音识别,性能提升 30%,百度怎么做到的?

Keep(将单词复制到输出中) Delete(删除单词) Keep-AddX(添加短语X到标记的单词前)  Delete-AddX(删除标记的单词)

2016年底,宜通世纪披露拟耗资10亿元收购倍泰健康100%股权。2018年,倍泰健康“爆雷”,宜通世纪也因此遭受巨额资产减值损失。倍泰健康的“爆雷”,引发宜通世纪2018年业绩滑坡,当年巨亏19.69亿元。今年以来,倍泰健康虽然恢复生产经营,但截至目前仍在亏损。宜通世纪为了解决因并购倍泰健康产生的不利影响,准备甩掉这个“包袱”。

上市公司高价买资产低价出售,为何干赔本买卖?在北京师范大学经济与工商管理学院教授李锐看来,一方面,临近年底,一些A股上市公司开始“花样式”处置资产力保全年业绩,不少上市公司“急甩包袱”;另一方面,部分上市公司跨界并购“炒概念”“讲故事”也带来了不良的后果。

同时还有预训练的模型,像 ERNIE 这种是结合了数据,已经做了预训练的,这些让开发者的使用门槛降低了。同时在开发模型的部署工具上面,有了 Paddle Lite 等端上面的部署工具。在服务端有 Paddle Serving,还有 PaddleSlim 做压缩等等。从模型的搭建到开发,到部署全链条,每个环节都可以做很多,这还只是框架层面。

喻友平认为,要让整个社会未来 AI 能够被普及,被社会化,需要满足这些不同层次的用户,在不同的环节,在不同的场景下面的需求,这个事情是一个系统工程。

百度还会面向一些细分领域做降低开发门槛的工作。例如面向零售行业,因为零售行业未来的智能化首先要基于数据化,而数据化是需要基于 AI 的数据化。比如这里面 SKU 的识别,毫无疑问是未来零售智能化的一个基石,所以百度把 SKU 智能识别放在 EasyDL 里面,做成了专门的 EasyDL 的零售版。

14亿元资产遭2元“甩卖”引起了监管层关注。深交所发函要求奥马电器就多个事项进行核查并出具书面说明,其中包括收购和出售中融金采用不同评估方法的原因及合理性;中融金未完成2018年度业绩承诺,具体说明已采取的措施,目前取得的进展及效果,是否足以保障上市公司利益等。

除了让想做 AI 的人能够更容易做到外,还需要打破阻碍 AI 普及的另一大障碍,就是相当多的人并不了解 AI,不知道能用它来做什么。谈到这里,喻友平不无感慨的说“AI 是一把手工程”。

至于拟将中融金100%股权作价2元出售,奥马电器表示,2019年以来,国内宏观经济形势、金融监管政策和互联网金融行业整体环境持续变化,中融金经营环境持续恶化,为避免中融金进一步对公司业绩产生负面影响,公司策划出售该金融资产。经评估机构评估后,截至评估基准日,中融金100%股权估值为-4.51亿元。公司依据评估报告对本次交易定价为2元。

近日,Google研究团队开源了一款文本编辑模型LaserTagger,可推理出一系列编辑操作,以将源文本转换为目标文本。研究人员断言,LaserTagger处理文本生成一般不易出错,且更易于训练和执行。

要做到这些,关键点是降低 AI 门槛,“我们的重点是怎么样让这些工具和这些服务更加简单,更加低成本。因为我们认为,在当前 AI 的发展阶段,要想办法让技术应用的门槛降低。”喻友平在接受雷锋网(公众号:雷锋网)采访时表示。

在他看来,AI 目前虽然有很多应用,但是拉到更长来看,可能还是在初期。“只有把工人们用的锄头做得更好一点,把工具做得更简单,才能真正让整个社会里面做 AI 的人能够能得到更好的支持。”

对百度 AI 技术生态部来说,AI 的商业化仍牌比较初级的阶段,收入还不是重点。喻友平介绍,

AI Studio 里面百度也做了很多工作,面向教育给开发者送了很多 GPU,同时在上面还做了很多的样例,还有很多课程、比赛,还有面向高校的教育版,他们可以直接在里面给学生上深度学习的课程。所有做的这些都是为了让大家去应用、学习、教育更加简单,所以可以分成很多个层次。

据喻友平介绍,在 AI 的应用中,从大的来说可以分成两个层次:一是开发集成层次,或者说是应用层次。比如说使用人脸识别做产品,不管是接口、SDK 还是做一些软硬集成。还有一个层次是真正去做模型开发。简而言之,可以认为前面这种是只需要做预测,模型都做好了,更多的是解决模型怎么部署,以及适应各种场景下面需求的问题。后面一种是要自己去做模型。

李锐表示,监管层应严格监管那些假借并购重组进行股价炒作的非理性行为。他认为在监管渐严的趋势下,通过“炒概念”“讲故事”等方法重组成功的概率会有所降低,但仍需警惕脱实向虚的跨界并购重组行为。

有市场人士质疑,此举有在年底前调节利润之嫌。不过,宜通世纪在12月16日晚回复深交所关注函时表示,该公司不存在年底处置资产突击调节利润的情形。

在推动信访制度改革措施落实方面,会议提出,改革是引领发展的第一动力。要根据党的十九届四中全会对信访工作的新要求和党中央、国务院关于信访工作系列决策部署,围绕确定的改革方向和目标,在巩固深化、对标推进、精准实施上下功夫,确保落地见效。