量子位 宣布 | 公众号 QbitAI

一文看尽Google I/O:史上最快手机语音操控不开口也能打电话_手机_才能 云服务

不忘初心,AI前行。
技能愈精,情怀越高。

刚刚,Google I/O 2019大会开幕。

2小时主题演讲,环球AI第一大厂秀出最新黑科技进展,并且情怀依然满分,Google用行动诠释科技向善。

今年大会演讲主题:Keep making magic.

究竟Google的最新黑科技邪术有哪些?量子位带你一文打尽。

开场:不忘初心

大会开始,Google CEO桑达·皮猜在一片欢呼中微笑登场。

劈柴哥说今年Google I/O,视觉能力分歧凡响,比如不雅观看办法加入了AR体验,通过手机,利用一个App就能身临其境、解答统统。

而且别看事情小,背后驱动是Google的初心和义务:整合环球信息,使大家都能访问并从中受益。

Our mission is to organize the world’s information and make it universally accessible and useful.

劈柴哥强调,正是这样的义务,让代代Google人推出更好的产品,帮用户更高效,让用户更快乐,要做更有用的Google.

统统自然离不开AI。

AI视觉成新入口

Google CEO先从去年推出的谷歌信息流提及,虽然这还遭到李彦宏感慨——谷歌学师百度,但劈柴哥阐明,希望能在准确搜索之后,进一步让用户更完全理解天下。

背后都是机器学习、AR和AI等前沿黑科技。

比如你Google一下搜索黑洞,Google AI就能给你推举干系***,包括给出一条完全的信息流韶光线,展示黑洞是如何被创造的。

这个中,Google还解锁了越来越多视觉能力,让用户想要的信息更直不雅观准确呈现。

比如利用AR视觉能力,搜索不仅准确供应结果,还能360°全面理解。

你想买一双鞋:

或者小朋友想理解大白鲨:

那有没有可能是看到一张图片,也想知道更多干系信息?

谷歌说Google Lens——智能拍照\图搜运用,为此而生。
而且不是拍照识别那么大略。

现在Google Lens还能做更多。

拍菜单,自动显示大众点评高赞菜,拍小票,自动打算金额和小费。

Google Lens只是入口,还结合了诸多其他Google App的能力。

比如舆图、翻译、大众点评……一个入口背后,集齐谷歌百口桶能力。

那如果大字不识一个,能不能享受到AI福祉?

Google拿出第一个情怀大知足案例。

用Google Go就可以了。

现场举例,在印度,文盲大姐姐通过Google Go,即便大字不识一个,还只能说印地语,也好手机拍照,然后让手机自动朗读出来,用智好手机理解想要理解的统统——无论线上还是线下。

目前,Google Go已经包含印地语、中文在内的10多种措辞。

谷歌团队将Google Go全体大小掌握在100kb以下,35美元价位(200元)的手机,有摄像头就能利用。

真正做到用得起、用得好,一款Google Go在手,世界说走就走。

毫无疑问,现场掌声和欢呼声一片。

AI语音助手更全能

视觉之外,便是AI在语音措辞方面的能力。

劈柴哥先从Duplex提及。

去年,Google推出了震荡四方的打电话AI系统Duplex,并在一年内实现了全美40多个州商用。

今年Google会把这项功能扩展到网络上,叫做Duplex on the web,帮你租车、预订电影票和餐厅座位。

比如你想租车,用Duplex打开租车公司的网站,这个AI就能代替你填写所有必要信息。
在提交订单之前,人类只须要核对一下信息点击即可。

Duplex还可以理解日历行程信息、Gmail邮件内容,自动在填写订单时补全信息。

怎么说呢,虽已过当红阶段,但Duplex变得更强更务实。

而Duplex之源——Google AI助理Google Assistant也有大进展。

Google宣告升级AI语音助手,并把语音交互能力完备放入手机。

精良到什么程度?

全体过程完备不用上手,也不须要反复用唤醒词,语音交互就能实现对手机的全过程操控。

更厉害的是语音识别速率保持在1秒以内,比用手更快。

现场小姐姐的演示,搞得民气激动。

Google阐明,之以是如此流畅,是由于他们谷歌数据中央的语音识别模型“塞进了口袋”,原来100GB模型被压缩到0.5GB,使得集成得手机中成为可能。

而且,更小的模型还降落了网络延迟,交互速率提升10倍。

值得一提的是,Google的语音助手,还能跨App操作、完成任务,比Siri不知高到哪去了。

现场举例,如果你正在和朋友谈天,溘然想发送一张过去旅游的照片,你只须要见告它你照片是在哪拍的、里面有什么内容,AI助手就能把照片直接发送过去。

只可惜,Google的AI语音助手,Google的这个福音技能,只能在Google“亲儿子”——Pixel手机上利用。

当然,依然是AI语音措辞能力,还有技能牛X,情怀满分的新能力。

Google AI可以给任何***加字幕。

之前,YouTube***纵然上传者没有给字幕,也能通过自动识别添加实时字幕。

现在Google把这个能力带到了任何***中——须要强调的是手机终端,没联网也OK.

无论是相册中自己拍的***、网页中的***、谈天***,统统能加上字幕,往后再也不怕地铁上看剧听不清对话了。

但如果只把技能用到这一步,Google就不会是那个人类希望了。

Google这次展示了Live Relay的技能,用语音识别和TTS,帮助聋哑人士接电话。

比如打进来的声音,转化成笔墨,然后让聋哑人可以像回答短信一样接电话,输入的笔墨会实时转写、自动变成语音发出去。

更知心的是,Live Relay还利用了Google智能预测和回答功能。
对打字内容做出预测。

不要担心打字速率跟不上语音,统统实时乃至“提前”进行,转写质量也很高,打字速率能跟上语音通话的速率。

现场都被Google的情怀填满了。

这项技能也被叫作:不开口就能打电话。

聋哑人群体能更好享受智好手机和AI的便利了。

安卓10:离线实时转写速记

接下来是最新安卓版本:Android Q.

Google先表露了最新成绩单,目前安卓设备已经打破25亿——环球60亿人,每4个就有1个利用安卓设备。

然后开始谈安卓往何处去。

首先是大热的折叠屏带来的影响。

折叠屏带来不一样的内容展示办法,也带来了更便捷的多任务处理。

以是Google认定折叠屏是趋势,对付折叠屏的准备,今年就会在安卓系统中表示。

其次是5G。

可以明确的是,今年就会有5G的安卓手机商用。

5G能带来什么?带来更快的网速。

也让更多AI能力可以实时发挥浸染。

比如刚才说到的***实时字幕,背后核心是AI语音识别转写。

但!
是!
Google放出大招,即便不联网,现在也能在最新安卓系统中实现实时语音转写。

由于Google团队把AI模型演习到了最小最高效,手机算力,手机数据,就能在手机本身实现这项AI能力。

接下来便是越来越受用户关注的隐私数据。

这次 Google 将会对系统的安全策略做进一步的调度:比如在文档管理中加入加密功能、掌握 App调取系统摄像头 / 麦克风的访问权限,以及防止App在后台随意获取用户位置等等。

在新系统中,用户可针对每个App所得到的权限进行调度,从而不让软件供应商通过App获取用户隐私信息。

除此以外,跟此前Android Q的测试版体验差不多,系统的设计和交互也有新变革:

比如,加入全局“阴郁模式”、新增 WiFi 分享功能、新增支持录屏及“桌面模式”、优化Pixel的线性马达效果,优化系统手势交互……

虽然是安卓系统首次加入,但不得不说,中国手机厂商在此之前,就已经基于老安卓版本,实现了很多类似功能。

中国手机厂商的微创新,不得不服。

Pixel手机:单摄AI吊打苹果

新系统,但没有新旗舰手机,推出小迭代版本:Pixel 3a和Pixel 3a XL.

开门见山,Google大方承认,Pixel手机价格太贵,以是须要两款中端手机——Pixel 3a和Pixel 3a XL来帮谷歌提升销量。

Pixel 3a供应三种颜色:玄色、白色、有点紫(比灭霸的紫色稍淡),保留了3.5mm耳机接口。

Pixel 3a依旧是天生骄傲,用AI和算法硬件劣势,依然保持祖传前后单摄像头,都可以供应背景虚化的人像模式。

现场展示照片,单摄的Google手机,夜景成像吊打双摄的iPhone X。

Pixel 3a定位中端旗舰,依然传承谷歌“买软件送硬件”传统,承诺连续3年的软件和安全更新。

更炫酷的AI能力也别放得手机里。

Pixel 3a现在能过滤骚扰电话,舆图AR结合街景导航,比看舆图箭头更直不雅观。

Google还把智好手机做到了AI智能和功能机功能的完美结合。

Pixel 3a一次充电,可以利用30小时,充电15分钟,可以用7个小时。

但是Pixel 3a的价格可是一点不中端,起售价399美元(约2700元),搭载骁龙670处理器、4GB内存、3000mAh电池。

2700元?能买2台同样配置的国产手机了。

难怪谷歌不好意思在发布会上公布参数详情,不辞官网查看是不知道滴。

更可笑的是,刚才说好的Pixel 3a XL,直接被跳过了。

Google官网显示,Pixel 3a XL售价479美元起,除了屏幕大一点,没有其他差异。

智能音箱炫脱手势识别

手机之后,来到智能家居环节,智能音箱为核心。

现在,Google把智能音箱划入了Alphabet旗下智能家居和物联网公司——Nest.

Google先祭出新时期的AI硬件产品打造理念:

AI+软件+硬件。

其次,带来新发布:

带屏智能音箱。

之前叫Google Hub,现在改叫Nest Hub。

一个背后加了音箱的平板电脑。

大小也都能选,百口桶系列。

当然,带屏带摄像头,还加入了AI刷脸的能力。

一个带屏智能音箱百口用,但刷你脸的时候,就只提醒你的信息,比如你的行程、提醒等。
千人千面。

其余,Google软件的能力也被集成个中。

打电话、谷歌相册,以及YouTube节目。

也有黑科技,比如手势识别:

一个手势,就能在你想要的时候达到目的。

详细售价:

Nest Hub售价129美元——866元。

Nest Hub Max售价229美元——1537元。

怎么说呢?幸好不在中国卖,不然能被中国智造的价格战杀得一蹶不振。
(手动狗头)

Jeff Dean压轴先容AI向善

末了,Google AI大总管Jeff Dean压轴登场。

他先回顾了今年来Google在NLP领域取得的最亮眼造诣——BERT模型。

然后自然是***的亲儿子TensorFlow,并且强调利用TensorFlow取得的新造诣。

依然情怀满满,向善优先。

比如最新在医疗AI推进方面,现在可以筛查早期肺癌,初步取得的准确率,可以给40%的早期患者提高生存率。

其余还有AI预测大水。

Jeff Dean说在印度,大水依然是威胁民众生命和财产安全的紧张磨难,但通过TensorFlow,就能实现大水的预测,还能更好方案排水渠道,最大限度降落大水危害。

这也是Google一贯以来提倡AI for social Good的理念成果。

Jeff公布了谷歌半年前环绕“AI向善”展开的2500万美元***投资成果。
这项名为“Impact Challenge”的寻衅赛,吸引了全天下各行各业的人才,这次***专门提到了印度和乌干达等地区的团队。

Jeff总结,寻衅赛自去年10月份上线以来,一共吸引了环球119个国家的公司、组织参与个中,已收到2,600多份申请,希望这会是一个好的开始。

希望Google能从整合环球信息的初心义务出发,借助AI,对用户更有用有益,做一个更有用的Google.

进而,Jeff Dean在此处宣告Google I/O 2019大会主题演讲结束。

场内场外,都以为这一结束来得过于仓促。

但,可能也有个不成熟的外界预测——Google高管也忙着看欧冠半决赛。

实在劈柴哥刚登场,就提到了本日有利物浦和巴塞罗那的欧冠比赛,希望不要耽搁大家。

结果,Google I/O大会演讲在开赛前掐表结束。

于是换台看球的球迷最新反馈:见证了一场奇迹般的绝地逆转。
利物浦掉队3球情形下完成4球反击,淘汰了梅西坐镇的宇宙巴萨。

所以是不是Google的AI提前预测到了?

— 完 —

诚挚招聘

量子位正在招募编辑/,事情地点在北京中关村落。
期待有才华、有激情亲切的同学加入我们!
干系细节,请在量子位"大众年夜众号(QbitAI)对话界面,回答“招聘”两个字。

量子位 QbitAI · 号签约作者

վ'ᴗ' ի 追踪AI技能和产品新动态