资讯详情
当前位置:首页 > 行业新闻 > 资讯详情

是什么让我们“隔空对话”张国荣

行业分类:数码IT 发布时间:2016-09-08 15:13

“一百年前,电能的出现,结束了人类在黑暗中的探索,为社会进步打开全新的大门,时光不歇,探索不止,另一扇大门已透出点点星光……”作为百度一年一度的技术创新大会,昨日(9月1日),2016百度世界大会在此前“AI is the New Electricity(人工智能是新的电能)”的预告下,终揭面纱。

为了显示百度是家高大上的公司,李彦宏之前一直很强调百度在人工智能上的投入,但是百度在这方面究竟做得怎么样?在昨天的百度世界大会上,李彦宏终于花了几个小时好好讲讲,这个他看做是百度大脑的人工智能技术

他认为,互联网的发展在此之前已经经过了两个非常重要的阶段:PC互联网到移动互联网。目前,中国市场网络渗透率已经达到50%,也就是七亿多。这意味着,未来互联网的增长不能再靠人口红利来驱动了。中国进入新常态,经济的增长需要靠“互联网+”行动计划来推动。

而李彦宏表示,百度在过去的五六年当中,投入了很多精力到人工智能的研发当中。人工智能对百度的意义,就是百度大脑。这个大脑在三年前相当于两三岁孩子的智力水平。

百度大脑包括三个部分:

计算方法。包括超大规模的神经网络、万亿级的参数、千亿样本和千亿特征训练;

计算能力。包括数十万台服务器构成了“百度大脑”的实体,几年前百度便开始自建中国最大的GPU集群

数据。全网的网页数据、十多年来累积的搜索数据,以及百亿级的图像、视频、定位数据。

百度大脑的能力主要有四个方面:

语音的能力。包括语音识别能力和语音合成能力。

图像的能力。图像能力指的是看到一个图片,不仅能看得见,还能看得懂。按照技术界的说法,它应该是计算机视觉。

自然语言处理能力。自然语言处理能力比语音和图像更难。语音和图像技术更多还处在认知的阶段,而自然语言理解除了要有认知能力之外,还需要逻辑推理能力、规划能力等等,同时也需要依赖于更为强大的知识图谱。

用户画像。用户画像在传统的AI中并不是主流。但是今天,我们每时每刻都可以收集很多很多和用户行为相关的数据,就可以对用户做很好的画像,而这里面使用的技术又基本上都是与人工智能相关的。

度秘一年间的成长

据了解,百度大脑在语音、图像、自然语言处理和用户画像领域都取得了前沿进展。从数据上看,目前,百度大脑语音合成日请求量2.5亿,语音识别率达97%,而百度大脑人脸识别准确率更高达99.7%。借助这些技术进步,自去年推出“度秘”后时隔一年,再度展示给外界的度秘成长了很多。

就在日前的2016百度世界大会上,李彦宏现场演示了多个例子,比如通过语音识别技术,不仅能帮经验不足的电话销售实时识别通话内容,还可及时分析、引导该销售人员的沟通方向,以至于电话另一边的客户的态度从“不需要”变成了“再考虑考虑”。又或者是,在现场合成再现一代巨星张国荣的声音,实现与粉丝13年后的“隔空对话”。

与此同时,数据显示,度秘和用户进行沟通的方式和传统的搜索已经很不一样了。现在人们与度秘的交互,有56%是通过语音或者图像来完成的,语音和图像的交互正逐步超越传统文字的使用频次,成为人们表达需求的主流方式。而度秘的自然语言理解的能力也在不断提升。

公开资料显示,早在2012年,百度便启动了人工智能和深度学习的研发工作,并于2013年成立深度学习实验室IDL (Institute of Deep Learning),此后吸引了包括吴恩达在内的一批世界顶级人工智能领域的专家加入。

值得期待的是,在时代变革大幕开启之际,为了助力广大合作伙伴全面共享AI时代,完成下一幕的转型升级,百度大脑将全面开放未来,百度大脑将与各行各业结合,衍生出不同领域的行业大脑,比如医疗大脑、交通大脑、金融大脑等等。


免责声明:本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,我们将根据您提供的证明材料确认版权并立即删除内容。