2023年AI更冷照样更热?数据要素成焦点三大年夜前沿趋势透析_数据_家当
作者 | 李水青
编辑 | 漠影
刚刚过去的2022年,是人工智能(AI)家当焦点快速切换的一年。
红极一时的打算机视觉、智能语音等AI算法赛道回归镇静,数据智能新领域变得更加炙手可热。
随着2022年东数西算工程、“数据二十条”等政策推出,数据的生产力要素地位更加凸显,发展大数据家当成为数字经济发展的急迫哀求。有名行研机构IDC预测,2026年中国大数据IT支出规模将达359.5亿美元(约合2438.13亿元公民币),复合增长率达21.4%。
有名国产大数据根本软件公司星环科技技能VP(高管)杨一帆见告智东西,前几年AI企业落地以单一模态技能为主,比如以纯挚的图象数据剖析支持图像识别、身份认证等运用。近年随着技能市场和运用市场的逐渐成熟和深入,单模态、单模型难以应对实际落地过程中繁芜场景的需求,为数据智能的进一步发展供应了动力。
作为人工智能三大要素之一,数据正为AI家当带来新的活力。杨一帆认为,面向新的2023年,多模态数据剖析、可信AI、开拓运维一体化有望成为家当发展的三大新趋势。
一、冲破数据孤岛,多模态数据剖析兴起
进入十四五数字化转型期间,我们看到政企行业数据的丰富程度和增长速率都很可不雅观,多模型、多模态数据成为AI家当发展的新特色。
随之而来的是严重的数据孤岛、知识壁垒,阻碍了AI落地进程。
以聪慧零售场景为例,当某阛阓须要从消费商批驳价研究特定人群的消费偏好时,他们至少须要利用人群“关系”、消费“记录”、商品“评价”平分歧来源或形式的数据进行剖析。按照传统方法,这些数据常日来自不同数据模型的数据库,而阛阓的剖析团队须要适配多种数据库的连接、查询、开拓、剖析技能等,不仅流程繁芜、效率低下会带来决策时效性差,而且数据不一致引起的决策误导也随意马虎涌现。
在这种背景下,一种基于统一架构的多模态数据剖析工具应运而生。
面向多模态数据剖析需求,星环科技多模型大数据根本平台TDH9.0(Transwarp Data Hub)提出统一架构:通过统一接口、统一打算引擎、统一分布式存储管理系统、统一的资源调度,汇聚十种数据模型组合拳,打通了大数据业务全场景。
比如基于TDH9.0,前文提到的聪慧零售数据剖析难题将被办理,客户能一举实现跨三个表联合剖析,同时无需额外数据导出或者转换,在准确剖析的同时简化开拓流程和用户操作。
值得一提的是,星环科技还通过知识图谱平台Sophon KG加持TDH9.0,增强多模态数据剖析的认知智能化水平。
以金融行业为例,Sophon KG开拓的图像和自然措辞处理模块,支持从文本、图像、关联数据、表格数据等多种类型数据中,自动抽取和推理行业、公司及机构名、地址、人名、产品、韶光等实体、关系和事宜,从而通过多模态数据剖析帮助干系机构智能化识别可疑交易、创造黑灰产团伙、画像贷款人违约风险、预测包管人风险等。
可以看到,多模态的数据剖析已成为AI家当落地急迫需求。它有利于企业冲破数据孤岛,进而从数据这一底层生产要素推动AI向认知智能进化,以此帮人们办理场景更繁芜的问题。
二、提倡数据流利交易,可信AI成刚需
随着AI落地进入深水区,AI还面临越来越多的可信寻衅。
比如AI模型可阐明性的缺少限定了AI独立运用,系统如何在利用数据的同时保护用户隐私,AI系统如何避免不稳定性带来的安全问题等,这些问题在近年来尤其凸显,《新一代人工智能管理原则》、《人工智能算法金融运用评价规范》《关于加强科技伦理管理的见地》等规范和标准相继发布。
进入2022年,东数西算、“数据二十条”、数据安全法及个人信息保护法等政策制度的推出,全国多家数据交易所落成,让数据生产要素的地位凸显,数据交易和运用有望迎来规模化阶段。可信AI技能,是促进数据智能家当规模化的条件和保障。
为实现“数据-AI模型-业务”全链路的可信,星环科技提出了一种通用的可信AI管理框架T-DACM。杨一帆对智东西解读道,这一领域具有“短板效应”,任意一个数据处理环节出问题都会导致终极模型不可信。
为此,T-DACM框架覆盖了AI开拓运用的全流程,从可信数据(Trusted Data)、可信算法(Trusted Algorithm)、可信打算(Trusted Computation)、可信管理(Trusted Management)四个层面,覆盖了数据安全、模型安全、隐私保护、风险掌握、过程管理、可阐明性、公正伦理、追溯追责等AI热点问题的办理方法。
杨一帆谈道,T-DACM框架能有效提升模型精度、办理模型黑盒问题。比如,在某银行授信系统案例中,据称该方案助其模型精度提升至99.2%,失落联用户率降落至0.4%,并通过引入模型可阐明模块办理了客户评分差异无法阐明等问题。
不过值得一提的是,从当前家当发展进程来看,AI模型的黑盒仍未完备解开。因此,可信AI治理发展任重道远,须要家当连续完善可信AI框架并在实际场景中迭代升级。
三、数据流水线成熟,AI开拓运维一体化
开拓运维一体化,是2022年AI行业发展的另一大趋势。
用数据科学赋能家当,说白了,便是通过数据特色提取、AI模型构建供应剖析做事,来促进业务降本增效、提升体验。近年来,随着数据和模型种类变多,散落在企业多个部门的管理和运维本钱也在变高,面临一系列寻衅。
对此,杨一帆认为,面向数据科学全流水线的转型正成为一大新趋势,数字化转型的客户须要开拓运维一体化。
面向AI落地,星环科技推出了企业级AI能力运营平台Sophon MLOps,环绕企业AI模型接入、运营管理、持续演习的全生命周期,分别供应规模化集成管理、高效模型推理、模型监控预警、模型性能评估、隐私安全保障等功能;同时,面向大数据开拓,星环科技通过TDS(Transwarp Data Studio,星环大数据开拓工具)供应DataOps能力;面向软件开拓,星环科技通过TDC(Transwarp Data Cloud,星环数据云平台)供应DevOps和数据云做事能力。
杨一帆说,DevOps供应了一个开拓集成的底座,DataOps供应了一个数据一直地集成开拓的条件,MLOps进行AI数据剖析方向的持续提升的义务。
通过将数据智能多个环节能力“连珠成链”,意味着家当流水线进一步走向成熟。可以预测,以星环科技为代表企业提出的全流程化的数据智能平台如果深入实践落地,有望促进家当生产力大大开释。
结语:AI落地进入深水区,数据要素主要性凸显
数据智能成为AI落地深水区的一大新焦点,通过对话星环科技技能VP杨一帆,我们进一步透析了数据智能所面临的多模态数据剖析、可信AI、开拓运维一体化几大发展趋势。
根据中国信通院最新研究数据,2021年我国大数据家当规模达1.3万亿元。随着数字化转型和干系新政策推进,家当的大数据平台技能也加速落地和迭代,有望促进2023年数据智能家当呈现新打破局势。
本文系作者个人观点,不代表本站立场,转载请注明出处!