从2012年景立至今,来自175个国家,384个城市的2亿用户选择流利说进行英语学习。
也是这2亿人,完成了逾39亿分钟对话和532亿句录音的数据积累,让流利说拥有了海内最大的"中国人英语语音数据库"。

专访流利说首席科学家林晖:大年夜数据时代算法让AI+教诲更有温度_产物_流畅 文字写作

作为一家人工智能驱动在线教诲产品孵化及创新的企业,流利说从成立之初,就把大数据作为公司发展的核心,以其核心的自适应学习,知足了大数据时期下不断多元化发展的措辞学习需求。

值得把稳的是,从成立到赴美上市,经由多年的发展探索和行业沉浮,今年第一季度流利说迎来上市后首盈利,公司实现营收1.99亿元,净利润1220万元,毛利率稳步增长至77.6%。
这是流利说上市以来的不断探索长续发展计策的阶段性成果,更凸显了流利说的产品代价主见。

在此契机下,我们有幸与卖力课程研发与AI算法的流利说联合创始人兼首席科学家林晖博士进行了深入对话,就流利说的产品脉络、核心壁垒,以及对用户的需求认知、AI技能的延伸方向以及未来智能教诲的技能趋势等进行了互换与磋商。

1移动互联网风口催生出的智能学习产品

在线教诲的行业抽芽始于2011-2012年,与互联网爆发的韶光点契合度较高,随着移动互联网技能推进,在线教诲行业,尤其是移动端在线教诲领域加速增长,呈现井喷式发展。
仅在2012年当年,百度来自教诲关键词投放的收入超过40亿元。

移动设备的遍及和互联网技能的成熟加速了在线教诲的发展,高速带宽与4G移动时期亦极大程度地提高了直播课程和碎片化韶光学习的可能性。

曾就职于Google的林晖博士,在过往的事情中积累了大量的语音识别、产品研究和业务产出方面的履历,而初期的行业调研结合创始团队外洋留学期间对英语学习的需求,让林晖博士及创始团队试图办理“哑巴英语”式的传授教化毛病,如此,便有了流利说最初的产品雏形。

格隆汇:作为最早的智能教诲倡行者,您和创始团队当时为什么会选择做这样一款观点超前的英语学习产品?

林晖:首先是由于我们看到了移动互联网的大趋势。
2012年的时候智好手机已经开始遍及,其背后带来实质的打算与人机交互的变革。
移动是载体,可以更好地承载随时随地的智能打算,同时,智好手机的摄像头和麦克风也为更便捷的人机交互供应了根本。
摄像头可以供应视觉理解交互通道,麦克风则是让更加自然、便捷的人机语音交互有了可能。
移动打算具备在一些场景里改变原有生活办法和商业模式的潜力,我们就想把握住这个风口在移动互联网上做一些故意思的事情。

当时团队不雅观察了金融、医疗、教诲等几个大行业,末了我们以为教诲是一个很好的切入点。
这跟创始团队自身的经历也有关系,从海内求学再到外洋留学、事情,再到返国创业,我们一方面是教诲的受益者,另一方面也看到了教诲行业某些低效率的存在,比如非常多的韶光被花费在学习英语上,但我们自身、以及周围同学、同事的普遍感想熏染是学习韶光很长,但开口能力却很差,背后影射的实在是措辞教诲的毛病。

2013年初,流利说就上线了初版的英语智能学习产品,搭载了智能化技能,比如用户可以录一段英文,算法可以对这段语音进行打分,流利说可以根据打分情形安排后续的学习。
这在当时是一个比较新潮的产品功能,推出之后我们的用户增长非常显著。

当时有一个主要的技能创新在于,我们须要把原来PC系统上的成熟算法做小,让它在手机端可以运行起来。
把PC端几百兆的系统做得手机里只须要几兆的内存容量,这对初版流利说app来说是非常主要的技能创新与打破,核心算法能够无需互联网就在手机上运行,这使得随时随地的即时反馈成为可能,游戏化的核心玩法也成为可能,同时避开了当时移动网络不稳定、资费贵的问题。

移动互联网端对如何将算法与产品结合,实在是提出了更高的技能哀求,以是对我们来说,率先将其产品化落地意义非常重大,后续技能层面的诸多优化、迭代都是在此根本上进行的。

格隆汇:流利说运营初期缺罕用户数据,但算法又须要数据反哺,如何启动?

林晖:流利说从一开始就在做AI算法落地,在过去多年的研发过程中形成了很多关于AI产品化的方法论。
比如在产品冷启动阶段,我们可以利用干系领域大量公开的数据构建模型,然后再迁移到详细的口语打分等领域,形成MVP可用的版本。
在这个根本上实现产品落地,通过产品的创新设计保障用户基本体验。
随后详细场景下的数据会随流量的增加而累积,用于算法优化,打造更好的产品体验,实现“产品形成-数据累积-算法优化-产品升级”的正向循环。

格隆汇:流利说可以为用户供应“个性化、自适应”的学习课程,我们该当如何理解“自适应”?

林晖:自适应学习的观点在教诲行业提的比较多,实在实质便是个性化的学习体验,以学习者为中央,自动为学习者适应性的调度学习体验。

但对付AI技能,用户可感知的大多在交互层面,隐蔽在后台的推举逻辑是不易被感知的。
以是『个性化、自适应』的观点虽然提的人很多,但很难去验证一款学习产品是不是真的具备自适应的功能,而且关心自适应是否真的给用户带来代价的企业就更少了。
流利说很早就不仅仅勾留在讲观点的阶段,现在已经进入了自适应学习探索的深水区,也是行业里真正推进个性化、自适应产品和技能的少数者。

我们在目前的商业链条上开展了非常多的基于强化学习的自适应算法A/B实验,比较不同模型和算法比拟用户留存、复购是否提升。
通过算法迭代和数据积累,在核心的学习产品上,我们把复购率提升了30%,这是个性化学习实效的用户代价和商业代价非常直不雅观的表示。

2海量数据推动算法优化及多元化业务发展

不断积累的海量数据持续赋能着算法模型的优化,完善了流利说的学习操作系统,赋能C端覆盖环球的在线措辞学习产品的升级、B端企业做事的加码以及措辞类学术研究等领域的拓展,逐步开释出更大的代价潜力。
隐蔽在后台的算法实际上最核心的任务便是理解用户,佐以成熟的数据剖析技能,“心腹知彼”后,创造、挖掘乃至是创造新需求是迎刃而解的事。

流利说通过多年的技能及行业沉淀,逐渐形成了由“测评类+内容类+推举类+交互类”组成的四大引擎,赋能更加多样化、定制化的需求做事。

格隆汇:根本技能的成熟会不会对流利说产生威胁,流利说的竞争壁垒何在?

林晖:我个人认为,单点技能不会构成技能壁垒,真正的壁垒在于智能技能与实际场景的结合,强调的是AI产品化的能力。

能形成竞争壁垒的无外乎四类,前辈的技能、网络效应、规模经济、以及品牌。

单点技能形成竞争壁垒我认为须要至少两个条件,技能性能比别人好至少10倍,并且有如专利等保护方法。
这类技能研发的投入每每也是巨大的,须要有大的技能打破,比如5G 技能。
另一种前辈技能的实现路径是组合式的技能创新,比如 iPhone 当时就并不是某个单项技能的打破,而是多项技能的组合式创新做出了改变时期的产品。

在智能教诲领域,我认为单点技能不会成为壁垒,我们更看重智能技能与场景的结合,强调的是AI产品化的组合式创新能力。
人工智能技能须要深入场景进行打磨,场景离不开产品和业务。
在实际场景利用中,与用户体验干系的技能哀求很高,而且须要多种技能达到一定效果后才能组合出好的用户体验的产品。
我们推出的AI外教便是一款这样的产品,如果只用市情上其他的语音或者图像识别技能供应方,就很难攒出达到同等的产品哀求及用户体验标准。

网络效应一旦形成是很好的竞争壁垒,尤其是超线性、指数级增长的网络效应。
在线教诲的网络效应是比较弱的,但我们也在过去的实践中落地了一些具有网络效应的链路,每增加一个用户都会增加产品给其他用户的代价,形成正反馈的循环。

规模经济方面,目前在线教诲行业面临着可以上规模但不经济的寻衅。
我们去年开始加强了在规模经济上探索,通过风雅化运营目前取得了一点小成绩,今年第一季度实现了上市后的首次盈利。
同时,流利说过去在智能化个性化学习产品研发的规模投入,沉淀成了包含四大引擎的学习操作系统。
基于这样的操作系统,我们可以在更多的学习领域更经济的生产的智能化学习产品,实现更大的代价开释。

所有的统统,末了都会归结到品牌。
在机会本钱和韶光本钱都比较高的教诲行业,品牌是很主要的。
流利说近两亿的注册用户,在英语学习领域是有品牌效应的。

不过总的来说,我认为在繁芜的商业环境下,一款产品、一个组织的竞争上风很多时候是综合能力的表示。

格隆汇:独占的数据库能否输出新代价,赋能流利说的未来业务?

林晖:数据的代价是巨大的。
前两年,我们出版了一本偏学术的书,把全国各地不同方言区学英语的语音进行了剖析,对付措辞学的研究、大学的英语教诲,都起到了比较积极的促进浸染。

学术代价只是冰山一角,海量的数据也帮助我们开拓出更智能化的产品。
跟读场景下积累的数据可以演习出最能听懂中国人说英语的语音识别引擎,成为流利说AI老师的根本能力之一,我们最新推出的Alix人工智能老师也在用户端得到了非常高的评价。

此外,流利说的多模态数据中储备了大量的用户学习行为数据,也在我们的AI系统里得到不断的处理、利用,使我们对用户学习行为和习气的理解不断深入。
从产品化角度来看,这些数据帮助我们构建起学习操作系统,可以作为独立产品用于企业培训和SaaS平台,未来我们将为更广泛的用户供应个性化学习体验。

格隆汇:未来流利说的产品会延伸到英语学习产品之外吗?

林晖:这是一定的。
流利说积累的AI产品化认知,通过对智能化、个性化学习进行解构,沉淀出了AI四大引擎,可以支撑和赋能多样化的智能学习产品。

测评类引擎支持形成性和总结性评估,其对学生工具的刻画和细粒度的评价支持,是任何学习产品和学习场景无法略过的环节;内容类引擎在对传授教化和练习内容等进行更底层的如知识点、技能点的自动、半自动化的构造抽取,同时也通过系统和人工智能天生算法提高优质内容的生产效率;推举类引擎则是在前两项的支撑下,做到个性化的推举;交互引擎紧张环绕学习体验进行,勾引用户实现心流体验。
这四类引擎通过多少 SaaS 化或者 PaaS 化的产品实现,综合成我们的学习操作系统,使得研发职员不用理解底层的智能技能就能够生产具备智能属性的学习产品。

目前,我们正基于四大引擎的学习操作系统在英语学习之外的领域和互助伙伴共同构建产品,为比如企业端客户供应定制化的需求做事。

3冲破冰冷感 凸显人工智能在线教诲产品的代价主见

智能教诲大势所趋,顶层设计的完善和不断呈现的行业新技能,将冲破行业发展瓶颈,推动智能教诲行业在不同场景下的代价实现。

在专访之前,笔者对人工智能也有普遍的刻板印象,认为AI是冰冷的,没有交互的。
未来算法要如何摆脱冰冷的触感,怎么让在线措辞学习产品更有温度,更贴近市场、贴近用户,实现真正的个性化学习,或许是未来行业探索的方向之一。
针对这个问题,善谈的林晖博士也分享了自己的意见。

从流利说角度出发,未来人工智能的“温度”将更多表示在通过对环球不断增长的在线措辞学习需求的深刻理解和持续探索,供应更加个性化、便利化且兼具实用性的自适应学习产品及配套做事。
未来,智能教诲在学校、家庭及移动场景中的运用实质上是进一步提高了用户的个性化需求,促进交互,这种交互并不是大略的数据对接,或者需求对接,而是在凸显产品代价主见的同时,也在通过人工智能技能,拉近了人与人、人与产品、人与场景的间隔。

格隆汇:AI的系统是固化的,但用户真个需求是动态变革的,流利说如何去知足变革的需求?

林晖:首先我不认为需求是一贯变革的,人类最底层的需求实在是不变的。
只是在需求不那么强的时候,会给外界一种变革的表象,须要我们去进行一些情景和感情的引发。

我卖力的上海市人工智能与认知学习重点实验在人脑认知方面做了些研究,实在人的各种行为包括学习的行为都是可以有较科学的阐明的。
大家都说学习反人性,但实在是没找到顺应人性的学习办法。
学习是可以自驱的,自我探索式的学习、有大家互动的学习等等都可以是快乐的,也是我们在努力探索的方向。

这里很主要的第一步便是对学习者认知状况的深度洞察和识别,实质是用户个性化学习需求的表达,也正是流利说的测评引擎和交互引擎去做的事情。
系统会不断评估用户的学习过程,在察觉用户学习状态和学习效果不好时,针对感情变革,调动更具吸引力的内容来提升学生的学习兴趣。
而且,要做到规模的个性化,肯定离不开机器和系统。
为每个人配一个真人老师随时随地对学习者的情形进行深度理解是不现实的,必须要通过系统和智能算法的帮助才能实现。

其余,AI系统也不是固化的,系统可以根据用户反馈、数据反馈等闭环进行迭代,现在的技能也能做到一定程度的根据数据进行自我更新和迭代,实现『进化』。
我们最近发布的AIix老师便是一个进化的系统,故意思的是虽然TA只是个AI,『我喜好这个老师』是用户喜好我们这个产品排名前三的情由。
实在不管是AI系统还是产品,投射给用户的是背后研发职员的温度,每一行代码,每一句笔墨,都可以通过『活』的产品去给用户通报存心的的温度。

格隆汇:未来智能教诲会向什么方向发展?

林晖:长远来看,我相信教诲的数字化、智能化的趋势是不可逆的。
详细的发展方向,须要根据不同的年事段、地域、学习内容、场景等划分来看。
大略讲下学校场景、家庭场景、以及随时随地的自学场景一些可能的发展。

在学校场景中,未来3-5年的变革会非常大。
数字化感知技能、硬件根本都已经成熟,国家对减轻学生作业和校外培训包袱的决心很大,同时将加大对数字化教诲转型的投入,接下来就看如何实实在在地改变老师传授教化、学生学习的办法,从而减轻学生的包袱。
可以预见的是,智能技能将校内场景进一步发挥代价。

在家庭场景中,政策限定了更低年事层的校外培训,但家长的焦虑、孩子更好发展的需求仍会真实存在。
可能这部分的教诲需求会转化到家庭场景中,智能教辅会为家长供应一些传授教化工具、输出传授教化理念,帮忙家长教诲孩子,促进亲子关系,勾引孩子更好地学习和发展。

在自主学习场景中,类似流利说的AI智能老师将在移动以及新的AR、VR平台迎来更大发展空间。
某些细分领域可能涌现超级AI老师,它会非常理解用户,并储备了该领域非常完全的知识体系,在此根本年夜将为用户供应个性化的心流学习体验。

浪潮之下固然不乏“裸泳者”,但更多的“良币”将迎来高速发展契机,大量的智能教诲技能、产品思考和空想有望在这一阶段成为现实。

末了,林晖博士向格隆汇表示,一款成功的智能学习产品,除了对技能的充分理解和前瞻性判断,以及凝聚一个精良的团队之外,更须要的,是对用户需求的感知、理解和把控。
他认为,“这种共情能力是很主要的,只有明白用户要什么才可能做出有需求的产品”。

俄国作家陀思妥耶夫斯基曾说过,天下上有多种多样的力量,特殊是意志和欲望的力量,它有沸腾的开水般的和烧红的铁般的温度。
或许,流利说也正由于有了这种贴近用户的共情能力,加上旨在以人工智能驱动助推实现教诲公正的初心,使得在线措辞学习产品真正摆脱冰冷感,也有着“沸腾的开水般的和烧红的铁般的温度”,赋能每一个人实现最大潜力。