J9九游会AG

人工智能正在让手机摄像头发生爆炸
发布时间:2017-11-06

从移动AI芯(xin)片的诞生起,这个系列已经(jing)追踪分析和报道过很多手(shou)机领域的新变化。但假(jia)如让我来总结AI和手(shou)机发生(sheng)(sheng)碰撞之后,最大的变化发生(sheng)(sheng)在哪里,答案可(ke)能只有一个:摄像(xiang)头。

 

blob.png


从技术逻辑(ji)上讲,搭载(zai)AI运算(suan)处理单元后的手机,结合本身GPU的图(tu)像(xiang)处(chu)理能(neng)力,最显著的能(neng)力提高就是(shi)在图(tu)像(xiang)内容生成、识别(bie)和处(chu)理上(shang)。无论是(shi)美(mei)颜、美(mei)景还是(shi)美(mei)视频,算法都(dou)能(neng)给你美(mei)出来。

 

但事实(shi)上,高端机们(men)不得不齐齐拥抱AI背后,或(huo)许(xu)还有更深层次的产业(ye)矛盾和现实问题。手机AI也不止带来了拍照更好看的简单(dan)提(ti)升。

 

本文中,J9九游会AG 将引用(yong)华为Mate 10iPhone X和谷歌Pixel 2三款加(jia)入(ru)了AI能(neng)力与运(yun)算单元的智能(neng)手机,来(lai)讨论AI带给手机摄(she)像头与拍摄(she)功能的(de)改变(bian)。

 

曾经J9九游会AG 认为手机只能打(da)电话(hua)发短信(xin),之(zhi)后(hou)buang的一声,手机被炸(zha)成了今天无所不能(neng)的智能机(ji)。随着AI的到来(lai),摄像头可能也在经历(li)一场类似的爆炸。

 

手(shou)机摄影已经进(jin)入深水(shui)区,创造(zao)差异(yi)只能用AI

 

为(wei)什么在短短几个月之间,苹果、谷(gu)歌、华为(wei)的主流(liu)旗舰机都宣布进入(ru)了AI时代?

 

最直接的(de)原因,显然在于高端机(ji)之(zhi)间不可(ke)避免(mian)年(nian)年(nian)上演的(de)拍照(zhao)能力大战,打到如今(jin)已经进入了无比惨烈的(de)拼刺刀(dao)阶段。

 

曾经跟一(yi)个爱写(xie)手(shou)机拍(pai)照(zhao)(zhao)评测的(de)(de)摄影(ying)师(shi)朋(peng)友聊天,他(ta)认为这两年写(xie)手(shou)机拍(pai)照(zhao)(zhao)评测真的(de)(de)是(shi)很痛苦的(de)(de)一(yi)件事。因为近似价位的(de)(de)手(shou)机之(zhi)间,拍(pai)照(zhao)(zhao)能力实在太接(jie)近了。拍(pai)了各个场景的(de)(de)对比图,一(yi)会这家强(qiang),一(yi)会那家强(qiang),根本归纳(na)不出结果来(lai)。即(ji)使严(yan)格按照(zhao)(zhao)DxOMARK这种(zhong)专业机构的评(ping)测标(biao)准来做,结果还是五花八门。

 

也(ye)有人觉得,在手机(ji)光(guang)学硬件和摄像(xiang)(xiang)(xiang)单(dan)元上(shang),摩尔定律(lv)已经接近失效了。随着双镜头(tou)(tou)、大光(guang)圈(quan)、千万以上(shang)像(xiang)(xiang)(xiang)素摄像(xiang)(xiang)(xiang)头(tou)(tou)成(cheng)为(wei)标配,摄像(xiang)(xiang)(xiang)头(tou)(tou)的(de)(de)核心单(dan)元群落似乎已经被固(gu)化(hua)。但手机(ji)还(hai)是(shi)要年年出,年年有改进。更要命的(de)(de)是(shi)对于高端机(ji)来(lai)说,摄像(xiang)(xiang)(xiang)部分是(shi)绝(jue)对的(de)(de)血海(hai)厮杀,绝(jue)不能落人一头(tou)(tou)——想想手机背后的(de)(de)研发(fa)者(zhe)和产(chan)品经理(li)们(men),也是够头疼(teng)的(de)(de)。

 

即使(shi)领军的(de)苹果,这几年在摄像(xiang)头也是前进的(de)举步维艰。甚至打开一些专业评测(ce)网站的(de)照(zhao)片(pian),普通用户很可能分辨不(bu)清两代机(ji)型,以及(ji)竞品(pin)机(ji)型拍摄照(zhao)片(pian)之(zhi)间到底有什么差(cha)别。

 

毕(bi)竟不(bu)是每个(ge)人(ren)都是摄(she)(she)影师和(he)艺(yi)术家,有那(nei)么细(xi)致的分辨能(neng)(neng)力(li)。所以为(wei)了让消费者继续感知拍照能(neng)(neng)力(li)在变化,必须在摄(she)(she)像(xiang)单元之(zhi)外想(xiang)办法——于是(shi)AI似乎成了最好的选(xuan)择(ze)。

 

人工智(zhi)能技(ji)术的(de)(de)引入,或(huo)许意味(wei)着手机可以(yi)凭借基础硬件的(de)(de)改变和大量算法助阵(zhen),来提升手机在拍摄、录制时的(de)(de)体(ti)验。创(chuang)造更(geng)多(duo)的(de)(de)玩法、更(geng)简单(dan)的(de)(de)体(ti)验,摆脱在光(guang)圈(quan)、像素等少(shao)数几个领域的(de)(de)无尽纠缠。对(dui)于渴望新消费(fei)增长点的(de)(de)手机厂商来说绝(jue)对(dui)是一场惊喜(xi)。

 

更重要的是,AI算力与(yu)算法(fa)在(zai)手机拍摄中的(de)应用,可以有多种(zhong)模(mo)式和方法(fa)。很(hen)难想象秘密研发的(de)旗舰机会(hui)在(zai)AI应用细节上(shang)撞车。这点在华为(wei)Mate 10iPhone 8/X之(zhi)间的(de)差(cha)异化中已经(jing)可见(jian)一斑,而这只(zhi)是个开始,更多技术与开发生态成熟后(hou),两款旗舰机之(zhi)间的(de)差(cha)距只(zhi)会越来越大。这是手(shou)机厂商们求之(zhi)不得(de)的(de)。

 

脱离同质化竞争的苦海,恐怕(pa)只能靠AI。所(suo)以,AI来了......

 

最(zui)后的(de)战役:算法和硬件(jian)能力(li)填补特殊(shu)场景

 

当(dang)然,AI可能改(gai)变手机的拍摄战争,绝不(bu)是说这场战役(yi)就不(bu)继续下去了。

 

事实上,在开创新玩法之前(qian),AI帮(bang)助手(shou)机拍摄(she)(she)完(wan)成的最后一场(chang)战役,还是会聚(ju)焦在主流手(shou)机攻坚了许(xu)多年的战场(chang):特殊(shu)场(chang)景(jing)拍摄(she)(she)。

 

这里所(suo)谓的(de)特殊场景,包括夜景、强(qiang)光、暗光、动态捕捉几个方面(mian),具(ju)体(ti)应用的(de)例子(zi)更(geng)是花样(yang)繁多(duo)。因(yin)为(wei)手机(ji)的(de)摄(she)像头注定没(mei)有纵(zong)深,所(suo)以无法像单反摄(she)像头一样(yang)来处理极限光环(huan)境下(xia)的(de)成像效果。因(yin)此暗光、强(qiang)光环(huan)境下(xia)的(de)拍摄(she),也(ye)逐渐成为(wei)评价一款手机(ji)摄(she)像能力好坏的(de)基本要素。

 

看一下(xia)DxOMARK的手机(ji)拍摄评分排(pai)名,会发现(xian)前五已经基本被AI手(shou)机所(suo)占据(ju)。而这些手(shou)机拍照能力的重(zhong)要加分(fen)项,就来自算法对光线环(huan)境的捕捉(zhuo)和平衡推(tui)导。比如(ru)谷歌谷歌Pixel 2会采用复杂的算法,比如对摄像(xiang)头(tou)收集(ji)信息进行拆分和模块(kuai)深(shen)度(du)学习,来达成精神(shen)效(xiao)果和光(guang)源重绘。因此在白光(guang)处理上获得了(le)高(gao)分。

blob.png 

DxOMARK的这张评测图中,可以看(kan)出应用了AI算(suan)法帮忙之后,各家旗舰机在处(chu)理光影关系时(shi)都较以前的纯光学模式有了显(xian)著改善,尤其是(shi)在匹配阴(yin)影与(yu)光亮的结构关系上。

 

算法捕捉(zhuo)技术(shu)不仅作用于静态(tai)拍照中(zhong),更多体(ti)现(xian)(xian)在高速运(yun)动环(huan)境(jing)下(xia)(xia)通过(guo)算法来(lai)实现(xian)(xian)超高速对焦(jiao),以及在暗(an)光环(huan)境(jing)下(xia)(xia)完成的识(shi)别+拍摄。

 

AI+手机拍摄,还能在比较复杂的(de)动作和特殊光线下实现(xian)动态美颜与视(shi)频美化。利(li)用底(di)层硬件(jian)+算法,智能机可以实现了单靠摄像头(tou)无法达成的很多功能。

 

但(dan)这只是提(ti)升(sheng),AI到来的真正意义在于(yu)让很多(duo)所谓常(chang)识发生改变(bian)…..

 

直(zhi)男救星:用AI的识别能力解(jie)放人(ren)类拍照(zhao)

 

请假设你是一位(wei)不热(re)爱拍照,但热(re)爱女朋(peng)友的直男……当你使(shi)用(yong)昂贵手机给女友拍照的时候,第一感觉是(shi)什么?

 

开心?忐忑(te)?NO,你(ni)的(de)第一感(gan)觉是复杂到心累。你(ni)会发现手机(ji)上(shang)一大堆(dui)功能,一会要HDR,一会要美(mei)颜美(mei)肤,一会要大光圈(quan)背景虚(xu)化,一会要景深模式(shi)......这要是赶(gan)上个暴脾(pi)气(qi),不是扔手机就是扔女(nv)朋(peng)友(you)。

 

事(shi)实上,会产(chan)生如此(ci)复(fu)杂的操(cao)作和专有名(ming)词。是因(yin)为为了处(chu)理(li)不(bu)(bu)同的拍(pai)摄对象和场景,手机必(bi)须模仿(fang)相(xiang)机的模式(shi),给(ji)出不(bu)(bu)同的曝光、白平衡和对焦策(ce)略(lve)。但(dan)更(geng)多的功能(neng)意(yi)味着更(geng)复(fu)杂的操(cao)作,世(shi)界上还是手残党多一(yi)点,是否能(neng)免去这一(yi)步呢(ni)?

 

对于(yu)AI加入(ru)手机这件(jian)事,或许一个十分(fen)值得兴奋的点(dian)在于,AI的(de)(de)主要(yao)能力之(zhi)一在于识别(bie)和理解图像。换(huan)言之(zhi),通过识别(bie)后(hou)的(de)(de)图像信息(xi)自(zi)动(dong)触发(fa)功能对应,或(huo)许(xu)意(yi)味着可以(yi)把(ba)拍照无能的(de)(de)直男们解放出(chu)来。

 

比(bi)如谷歌的Pixel 2就(jiu)很大(da)程度上利用了(le)AI的识别能(neng)力(li)来拍照。在它的摄(she)像单元里,隐藏着一个神经网络算法,专(zhuan)门用来分辨(bian)拍摄(she)中(zhong)的人物信(xin)息。然(ran)后传(chuan)输到(dao)后端进(jin)行不同阶(jie)段(duan)的对应图片处理。

 

当然(ran),谷歌的(de)这个技术(shu)主要目的(de)是让(rang)但摄像(xiang)头来获取双摄的(de)美颜拍照(zhao)背景(jing)虚化能力。而(er)华为Mate 10的识别+拍摄,也即其(qi)宣传的(de)智(zhi)慧(hui)摄影模式似乎是(shi)更激进(jin)的(de)方案(an)。Mate 10的(de)处理方(fang)式(shi),是通(tong)过NPU来先期学习图片(pian)的信息特征,从(cong)而(er)获(huo)得给拍(pai)照对象(xiang)分类的能力(li)。然后组织(zhi)成13种(zhong)拍(pai)照模式。

 

当(dang)摄像头(tou)在(zai)拍(pai)摄时触发了这(zhei)种模(mo)式,手机将自动调到(dao)对应的模(mo)式。

 

事实上,这种先识别后拍(pai)摄的(de)模式很可能(neng)在(zai)短期(qi)(qi)内成为(wei)通行的(de)标配,甚至取(qu)代(dai)一部分常(chang)用功(gong)能(neng)。毕(bi)竟在(zai)J9九游会AG 日(ri)常(chang)生(sheng)活(huo)和(he)社(she)交中,拍(pai)摄照片的(de)目(mu)的(de)和(he)期(qi)(qi)望效果是有高(gao)度一致(zhi)性的(de)。通过(guo)AI带来(lai)的深度学习(xi)能力归纳这些特(te)性,智(zhi)能化完成用户期许(xu),或(huo)许(xu)才是未来(lai)摄影的常态(tai)。

 

也许不久(jiu)的将(jiang)来,你到了(le)海边(bian)结(jie)果下(xia)雨,到了(le)景区遇上雾(wu)霾,到了(le)好莱坞没有大明星,就可(ke)以用AI来(lai)造蓝天白云青(qing)山绿水,甚至(zhi)弄出(chu)来(lai)几(ji)个偶尔路过(guo)的明(ming)星侧影.....

 

当然(ran),AI的识别+拍摄能力,真正(zheng)应该解放(fang)的(de)是老(lao)人、孩子以及大(da)多数(shu)只是偶尔采用(yong)手机拍照的(de)普通人。毕竟J9九游会AG 大(da)多数(shu)人无(wu)暇学习复杂的(de)教程,锤(chui)炼高超的(de)审美,但J9九游会AG 还是希望让精心准(zhun)备的(de)一刻留下更(geng)漂(piao)亮的(de)记忆。

 

AI让世界更(geng)公平,也许正(zheng)是如此。

 

已经发生的大爆炸:摄像头(tou)不(bu)只用来拍照(zhao)

 

上面介绍了两种(zhong)可见的AI+摄像头(tou)模(mo)式(shi):AI提升拍摄和AI改变(bian)拍摄(she)。而AI还带给摄像(xiang)头另(ling)一种(zhong)赋能:不只用来拍摄。

 

目前所(suo)见,这重功能已经有两种思路(lu):第一种iPhone X为(wei)代表的,在(zai)感(gan)知(zhi)能力上做文章,将摄像头与(yu)传感(gan)部(bu)件(jian)结合生成新的体(ti)验与(yu)功能。

 

iPhone X摄像(xiang)头(tou)在结合了(le)新的感(gan)光元件以(yi)外(wai),更重要的是加入了(le)相当复杂(za)的传(chuan)感(gan)器(qi)系统。尤其是在前置摄像(xiang)头(tou)上(shang),用刘海里原深感摄像头实(shi)现了生物识别(bie)和(he)动(dong)态(tai)捕捉,达(da)成了Animoji和人像光效等(deng)特(te)色功能。

 

另(ling)外Face ID也(ye)是通过类似功能(neng)来实现的(de)结构光(guang)(guang)(guang)识别。泛(fan)光(guang)(guang)(guang)感(gan)应元件还能(neng)在(zai)暗光(guang)(guang)(guang)状态下帮助用户(hu)解锁(suo)手机。这种思路(lu)或许意味(wei)着,摄像头以后不仅仅是看见,而更多可以感知外在。目前作用仅(jin)(jin)仅(jin)(jin)是人脸识(shi)别和一(yi)些特(te)色功(gong)能(neng),但距离运用硬件和算法基(ji)础开(kai)发更多功(gong)能(neng)应(ying)该已经不远了。

 

而(er)另一(yi)种(zhong)模式,是通过摄(she)像(xiang)头本身的(de)机器(qi)视觉能(neng)力(li)(li)来获得(de)数据学(xue)习和智能(neng)体成长(zhang)能(neng)力(li)(li)。加入记忆(yi)和学(xue)习能(neng)力(li)(li)的(de)AI摄像(xiang)头不仅是记录影(ying)像(xiang)信(xin)息,并且还会在本地完成(cheng)(cheng)对(dui)这些信(xin)息的学习和理解。从而(er)适(shi)应用(yong)户(hu)习惯,达成(cheng)(cheng)更好的拍摄体(ti)验。

 

这两种方式都意味着,手机AI带来(lai)的(de)不仅(jin)是摄像(xiang)能力(li)(li)本身(shen)的(de)提升。而是将摄像(xiang)头作为信息(xi)采集方式之一,纳入更庞(pang)大的(de)能力(li)(li)体(ti)系里(li)。以(yi)此培养出手(shou)机(ji)的(de)精准识别能力(li)(li)、多(duo)元数据处理能力(li)(li)、内容(rong)输出能力(li)(li),这对于未来(lai)才是至关重要的(de)。

 

或许等到开发者开始(shi)集体(ti)思考(kao)这(zhei)些能力意味着什么,移动AI带(dai)给影像世界的(de)真正价值才(cai)会浮现出来。

 

AI可以改变手(shou)机的很多方面,但从根(gen)本上说,它想改变的是被看做常识的人机交互方式(shi)。

 

原文链(lian)接

 


上一篇:
下一篇: