人工智能时期评价的理念创新

对话 | 学评融合: 人工智能时代的教诲评价_评价_学生 科技快讯

魏宁:2020年,中共中心、***印发了《深化新时期教诲评价改革总体方案》,明确指出“教诲评价事关教诲发展方向”,哀求“系统推进教诲评价改革,充分发挥教诲评价的指挥棒浸染,努力培养担当民族复兴大任的时期新人,培养德智体美劳全面发展的社会主义培植者和接班人”。

在二十大报告中,也明确提出了“深化教诲领域综合改革,完善教诲评价体系”的哀求。
当前,在***大报告对新时期新征程教诲奇迹作出的计策谋划下,我国教诲领域正在全力奋进。
张教授,您如何看待新时期教诲评价的主要意义?

张生:近年来,教诲评价在教诲改革中的导向浸染愈加凸显,刚才你提到的《深化新时期教诲评价改革总体方案》,对教诲评价改革做出了顶层设计和详细支配,但改革的关键在于落实。

特殊是随着以互联网、大数据、人工智能为代表的当代信息技能的快速发展,评价手段更为丰富、多样,为评价改革带来了新的契机。
当然,这也急迫须要我们加紧探索,对新时期的教诲评价给出有力的回答。

魏宁:您提到了新技能发展对教诲的冲击,我想这对付教诲评价来说既是机遇,也是寻衅。
《深化新时期教诲评价改革总体方案》中就特殊指出,“创新评价工具,利用人工智能、大数据等当代信息技能,探索开展学生各年级学习情形全过程纵向评价、德智体美劳全要素横向评价。
完善评价结果利用,综合发挥导向、鉴定、诊断、调控和改进浸染”。
您如何看待人工智能时期的教诲评价?

张生:人工智能时期的教诲评价改革呼唤理念与实践创新。
实践创新的根源在于理念创新,没有前辈的理念引领,实践难免落入窠臼。

21世纪以来,随着生理与认知丈量技能的发展,评价也从“为了却果的丈量”转向“为了诊断和改进”,“以学习为中央”的评价理念逐步成为共识。
但受制于学习环境与技能条件,“以评匆匆学”在教诲实践中仍旧存在不少问题。

当前,教诲已经进入人工智能时期,在物理天下与数字天下双重发展的根本上,深入研究教诲评价的新理念、新方法和新技能并利用新模式,是促进教诲评价改革的关键。

魏宁:在以往“以评匆匆学”的实践中,存在哪些问题?我们应该若何办理这些问题?

张生:首先,是评价与学习分离的问题。
为了实现对学习过程与结果的精准判断,评价就必须与学习保持高度的同步性。

例如,在学习进入新的阶段前,应尽快创造并改进上一阶段存在的缺点观点,以免影响后续的学习,这也是形成性评价涌现的紧张动因之一。

但目前的评价更多是外在于学习过程的活动,这就导致评价给学生和西席带来了额外的包袱,如过于频繁的测试、学习过程中提交的文件和照片等记录性数据。
这些都是评价与学习分离带来的问题。

其次,评价对学生认知的影响有限。
这表现在:一方面,评价紧张指向学习的行为与结果层面,评价指标中包含了大量的成绩、奖状、证书类的结果性指标;

另一方面,仍有大量学习过程游离于评价之外,特殊是一些涉及高阶思维、开放性和主不雅观性强的问题。
这些都让当前的评价对学生认知的影响有限。

再次,学生尚未成为评价活动的主体。
评价的目的是供应学习反馈,反馈只有被学生利用,并为其所接管,才能起到改进学习的浸染。

在传统评价中,学生只是被动地接管评价。
随着评价理念从关注结果转向支持学习,学生的自评和互评才逐步进入教诲事情者的视野。
但总的来说,学生在评价中的参与度依然较低。

我们认为,办理上述问题的关键是让学习和评价真正领悟起来,树立并践行学评领悟的理念。
评价不仅是对目标是否实现的剖断,更要通过评价中涉及的创造、考验、反思、评论、参与等过程直接促进学生高阶思维的发展。

学评领悟超越了对知识技能的学习结果及学习过程的丈量,指向了更深层次的支持学习的“元学习”,也便是“学会如何学习”。

学评领悟是对学习过程评价和学习结果评价的领悟统一,通过将评估要素融入学习活动,不仅能真实地反响学业造诣,优化学生的学习,还能进一步助力学生未来的学习,促进终生学习能力的提升。

魏宁:您刚才提到了要让学习与评价领悟起来,对付学评领悟这一理念,能否给出更详细的解读?它的观点和内涵是若何的呢?

张生:我们认为,学评领悟是基于数字天下的教诲。
当前,数字文明信息极大丰富,人才培养目标不断转变,基于评价过程和结果利用提升个人、群体思维和数据决策等高阶思维能力,是教诲评价理念改造的关键。

学评领悟理念是统筹评价的学习性和诊断性为一体,强调以多种办法促进学生主动发展的一种评价新理念。
它强调通过数字天下将评价融入到学生的学习活动过程中,鼓励大家展示分享成果、大家参与系列评价活动,基于评价过程与评价数据不断反思改进,促进学生自身核心素养的发展;通过数字天下记录的学习过程数据和评价过程数据,建立各种模型来打算学生认知、社会性、生理等多方面素养的发展,再以可理解的办法呈现出来。

魏宁:相对付传统的教诲评价,学评领悟有哪些光鲜的特色呢?

张生:学评领悟的评价理念有别于传统的评价理念,它至少在五个方面表现出光鲜特色:

一是强调评价的学习性和诊断性的领悟。
这是学评领悟理念的紧张特色,指先发挥评价的学习性功能,再基于学习过程数据进行数据建模评价,这不同于传统意义上先诊断再改进的评价理念。
它的评价流程更简捷,更能指向学生核心素养的发展。

它强调依托数字天下,将评价中的各核心要素融入到学习活动中,以学生为主体,鼓励大家参与展示、大家参与对他人的评价,让每一位学生都能在评价活动中提升自己的核心素养,通过评价反馈改进学习。

二是强调评价过程是一种高阶思维的学习活动。
学评领悟强调学生在原有认知展示根本上,在阅读他人作品、评价并提出改进见地的过程中,思维再次得到升华,思维的深度与广度得以发展。

这个过程既是总结他人上风与不敷、加深对差错认识的“知彼”过程,又是通过对他人作品进行评价,逐步认识事物的多面性,进而改进自己作品的“心腹”过程,通过“心腹知彼”的评价活动,发展核心素养,提升思维境界。

三是强调基于学习过程的诊断评价。
学评领悟通过物联网技能、大数据挖掘技能和智能决策与可视化技能,建立学生的认知发展、学业发展、社会性发展平分歧方面的打算模型,以及一系列决策预警剖析模型,并基于不同地域和群体特色构建不同的学习者特色模型,可以实现动态诊断、决策反馈。
不仅能够呈现学生当前的发展状况,还能对未来的发展状况进行仿照推演,从而提早采纳方法调度教诲传授教化。

四是强调对数字天下的利用。
学评领悟一定是基于数字天下开展的评价,只有这样才能充分发挥数字天下展示、分享、互换、评价、自动打算、智能决策和可视化的优点。
在人工智能时期,数字天下的时空泛在、物理天下的时空拓展,让大家展示、差错评价、个人反思与改进可以常态化地开展,学评领悟的高阶思维特点可以得到常态化的演习和发展。

此外,数字天下能够大规模、常态化、个性化地进行数据剖析,不仅能为个人供应有针对性的学习过程报告,提出有针对性的建议,助力个性化学习,还能支持科学管理与决策,及早创造区域性、群体性问题,进而大幅度、大规模提升教诲传授教化质量。

五是强调保持学生的好奇心。
这是学评领悟最关键的特色,评价的目的是让学生体验自身的进步和成功,保持与生俱来的好奇心。
在传统评价理念下,评价与学习分离,全体评价过程完备由西席主导,学生则是被动地接管评价,这扼杀了学生的好奇心。

而在学评领悟理念下,大家都能展示自己的优点和不同,也可以创造他人的优点和不同,进而对事物保有充分的好奇,营造出积极向上的育人氛围。

魏宁:在践行学评领悟这一新的评价理念的过程中,新技能无疑将发挥主要的浸染,可以说,学评领悟的落地有赖于全新的数字化环境,您如何看待技能对学评领悟的常态化、可持续开展的推动浸染?

张生:新技能对学评领悟理念的落实有着重要的推动浸染,这紧张表现在三个方面:

第一,技能可以有力推动学评领悟的日常化。
学评领悟中关键的自评与互评环节,就有赖于信息技能对物理学习空间的时空拓展。
将评价活动内置于学习平台中,一方面让评价成为师生的“规定动作”,使其养成评价的习气,另一方面支持了西席和学生的多样化选择,为师生的日常运用创造了更好的条件。

此外,学生还可以随时随地在平台上对自己或他人的学习情形进行回顾总结、评价反思,如在学习平台上撰写学习日记,针对不同学科的不同知识点或内容进行自我评价,以笔墨形式评价自己是否达到了阶段性的学习目标,剖析自己在学习中付出的努力,对当前的学习结果进行归因并提出下一步改进策略,等等。
同学之间也可以随时进行互换与互评。

第二,技能可以有力提升学评领悟的认知品质。
通过信息技能对韶光和空间的延展,学生有机会从大量的差错表现中汲取可借鉴之处,拓展自己的思路,加深对主题内容的理解,这为学生创造了多元的评价机会,成为提升认知品质的主要手段。

此外,在利用评价标准和对评价标准的内化过程中,学生的评估素养和学习能力将同步得到提升。
通过为西席供应的将评价标准内嵌于平台的功能,哀求学生在评价过程中必须明确自己的评价依据了哪一条标准。
还可以通过设置评语最少字数、监测评语内容与评价标准干系性等办法,减少随意评价,让评价过程及内容牢牢聚焦学生认知与元认知的发展。

第三,技能可以有力增强学评领悟的参与性。
环绕核心素养的学评领悟,实质上是一种高阶思维的学习活动。
差错互评产生的质疑、争辩、论证等交互行为,不仅能促进学生的反思,而且能引发群体互动的氛围,使学生深度参与到学习和评价活动中来。

因此,网络学习平台必须具备许可被评价者依据反馈对评价者做出回应和质疑的功能。
由于,能够引发被评价者回应与谈论的评语每每是高质量的评语,支持对评语的再评价或反馈,是对提升评语质量的一种鼓励,是对发展学生高阶思维能力的促进,要鼓励学生给出切实、中肯、有针对性的评语。
还可以创造更丰富、更具选择性的技能环境,如让学生自主选择评价工具或选择自己被哪些人评价,从而建立起学生对评价活动的积极预期,增加对学习及评价任务的认知和情绪投入。

人工智能时期评价的实践形态

魏宁:通过您的描述,我们理解了学评领悟理念下的教诲评价的基本样貌,这种以数字天下的利用为根本的新型评价理念,在传授教化过程中是如何开展的呢?

张生:学评领悟在实践中的利用,重点强调评价的学习功能和诊断功能。
在实际操作中,评价作为一种高等思维的学习活动,包括天生与展示、参与评价活动、反思与改进三个核心阶段。

个中,学生思维的天生与作品的展示是学评领悟理念落地的根本,它强调西席要利用数字天下重构育情面况,优化学与教的办法,强调学生从消费为主转变为天生为主,从而形成为了天生而消费的新型教与学办法。
在学生天生的根本上开展大家展示,展示可以在物理天下中进行,但我们更强调的是让常态化展示和分享发生在数字天下中。

以人为核心开展自评或他评的学习活动是学评领悟理念落地的关键,我们倡导跨学科的教研办法,核心便是评价一定要以人为出发点。
不论自评还是他评,都是学生在主动参与评价,通过多种办法的评价,匆匆使学生不再勾留在原有的大略认知上,进而萌发出对事物更深层次的理解。

及时性和迭代性的反思与改进是学评领悟质量的提升哀求。
不论是从评价还是从支持自我调节学习方面看,目前大多数的研究还未能聚焦反思阶段,而学生利用评价行为表现信息在反思阶段做出改进是至关主要的。
在参与评价活动后,学生将创造很多相似或完备不一样的作品,从而拓展思考问题的角度和办法,以此为根本的反思和改进将是认知水平的又一次提升。

魏宁:通过您的先容,我们看到了学评领悟在物理天下与数字天下中相互交融的美好场景。
要想开展这样一种基于高阶思维能力的、核心素养导向的评价,新技能和新方法是必不可少的。
实在,在目前的教诲评价中,也有不少的技能工具用来支持评价活动的开展,您以为这些工具存在若何的不敷?

张生:以差错互评这一常见的评价环节为例,干系的支持工具可以说非常之多,如PeerGrade是一款支持作业互评的工具,Peerceptiv是一款支持“写作”的文本互评工具,PeerWise是一款支持“出题”活动的工具。

像这样的支持互评的工具还有很多,Luxton-Reilly就曾经系统梳理了18种差错互评工具,它们大都支持评价标准的设置,以及评分和评语两种评价办法,在一定程度上促进了差错互评的开展。
但它们普遍缺少对评价者与被评价者之间互换谈论的支持,难以通过互换谈论进行迭代反馈。

总的来说,这些互评工具紧张是站在评价的诊断性角度设计的,还不能知足我们提倡的学评领悟下的个性化需求。

魏宁:在学评领悟环境中,可以通过什么方法、工具战胜这一毛病呢?

张生:要想让学评领悟这一新理念变为现实,离不开数字天下中全新的评价环境的创设。
在目前的教诲评价环境下,更多的因此诊断性评价为主,这不利于开展广泛、深入的评价交互,学生的主动性、个性化需求都难以表示。

因此,以个性化、项目化、数据化、极简化为原则,创新性地设计各种评价工具和环境,对学评领悟的高质量开展具有主要意义。

《责任教诲课程方案(2022年版)》中将更新评价不雅观念、创新评价办法方法作为深化传授教化与评价改革的主要侧面,提倡开展作品展示、口头报告等评价活动,关注提高自我评价、总结、反思和改进等能力的功能。
在学评领悟的环境设计中,我们以主题论坛为载体,设计包括评价卡、实时反馈等工具在内的评价环境,用来促进学生高阶思维和核心素养的发展。

详细来说,是借助主题论坛履行评价,主题论坛支持点赞、评分、评语等多种评价办法,以及文本、图片、音频、***等技能手段,可以知足学生的个性化评价需求。
在主题论坛中,师生可以自主选择同步、异步两种交互形式,在交互中建构知识、发展能力。

同时,学生在论坛各个环节的发布、回答、评论、反馈等内容都将累积形成数据库,用于多种特色的诊断,为西席改进传授教化、学生自我反思供应依据。

在进行评价时,我们为学生供应在线的评价卡。
当学生出题时,它便是一块“答题板”,支持出题、做题两种活动形式;当进行他评时,它便是一块“评分板”,支持标准设置、自主选择。
在评价活动中,评价卡产生的过程数据可以挖掘学生的领域能力、评价能力、评价偏好与习气等,作为西席改进和学生评价的依据。

实时反馈工具也是实现学评领悟的关键,它重在实时性和可视化,可以促进学生对作品与评价的及时理解和改进。
一方面,技能环境在展示、互评、反馈等各环节无需韶光间隔,使学生能够实时改进学习;

另一方面,实时反馈工具可以通过“分布”功能,以图表的形式展示评分、作答数据分布,通过“排行”功能,以排行榜的形式展示评价参与情形排行,这些办法都以可视化的形式直不雅观呈现繁芜数据,促进师生的理解和改进。

实时反馈还有助于学生在群体中构建个体履历,调节评价过程。
可视化能够帮助学生在评价中理解自己,也理解他人,做“心腹知彼”的评价,明晰自己在一个群体中所处的位置。

魏宁:学评领悟理念下的个性化评价的详细运用流程是若何的呢?

张生:学评领悟理念下的个性化评价,一定要以常态化运用为目标。
依托上述的主题论坛、各种实时反馈工具,由师生共同完成评价活动,实现评价的学习性和诊断性功能,促进学生高阶思维和核心素养的发展。
下面我为大家描述一下它的运用流程。

首先设计评价项目,西席在主题论坛上利用评价主题、评价卡创设与学习目标干系的任务情境和活动操持。
例如,培养学生的识记能力,西席环绕这一内容出好题目,供应评价标准,学生依据标准比拟自身评分、西席评分和群体评分的差异。

在评价任务发布后,师生须要运用评价卡分组完成评价。
学生可以选择文本、图片、音频、***、测试题等形式展示自己的作品,并通过点赞、评分、评论、评价卡答题等办法开展评价。
学生还可以通过设置分组的名称、类型和优先级,选择期望参与评价的主体,筛选评价工具,知足自己的个性化需求。

在全体评价过程中,学生可以通过实时反馈工具的各种功能查看评价与被评价数据的情形,查看不同选项和得疏散布,查看群体参与情形排名,吸收到被评论的提示信息,在群体中展开深层次的交互反馈,通过协商调度作品和评价。
西席可以通过实时反馈工具查看特定群体的作答情形和评疏散布,理解学生间的差异,借助回答、评论等功能为学生供应辅导,保障活动按操持进行。

魏宁:我们看到,学评领悟下的个性化评价的运用流程在评价活动的设计上和技能运用的办法上都是非常丰富的。
那么,在日常传授教化中,它又有哪些范例的运用处景呢?

张生:实在,学评领悟下的个性化评价可以和日常传授教化的多种场景领悟,既可以作为独立的项目式课程,也可以作为一样平常教室中的一个评价环节,还能作为课后的项目式作业。
不管哪种运用处景,它都须要经历“天生与展示”“参与评价活动”以及“反思与改进”三个核心阶段,但是每个阶段的持续韶光、繁芜程度须要根据详细情形灵巧调度。

例如,在独立的项目式课程中,要把提高学生的评价能力作为课程的主要目标,西席须要创设多样化的评价情境,让学生广泛、深入地参与到评价标准订定、作品展示与评价、评价结果解读等活动中,每个活动都要经历天生、展示、评价、协商、反思、改进的过程。

在一样平常教室中的评价环节,由于韶光有限,须要西席结合详细传授教化内容,剖析评价需求,重点环绕当前传授教化设置评价项目。
如果传授教化目标指向知识影象,只需让学生回答相应题目,再查看答题结果分布;如果传授教化目标指向知识的深度理解和高阶思维能力,则须要让学生出题、答题并评价题目;如果传授教化目标指向人际沟通能力与作品理解能力,则须要开展“评他”活动,即让学生对他人不雅观点予以评分或评论。

人工智能时期评价的办法选择

魏宁:在人工智能时期,多种技能工具的参与、多样化评价办法的设计,使得学生能够以更加多元化的办法展开评价,大大丰富了传统意义上的评价方法、手段、路径,为学生的评价供应了更多的选择。
在这种背景下,学生更喜好若何的评价办法?在评价的选择上,有没有一定的偏好?通过您的研究数据,能否为我们揭示一些这方面的“规律”呢?

张生:随着人工智能时期的到来,学生的评价办法也在不断发展、创新,各种新型的评价办法不断呈现。
在学评领悟过程中,学生可以自由选择评价办法,我们通过对大量的学生评价数据的调研与剖析,对学生在评价办法选择上的偏好以及不同选择带来的影响进行了一些初步研究,下面和大家分享一下我们的研究结论。

在评价办法的选择上,我们通过大量调研创造,常常采取评分办法的学生略多于采取评语的学生,在采取评语的学生中,大约有五分之四的学生选择笔墨办法,只有约五分之一的学生选择音频或***办法。

在不同性别学生的选择方向上,男生更多地选择评分办法,而女生更青睐于评语的办法。
在评语办法中,不论男生还是女生,选择笔墨办法的比例都远远高于选择音频或***办法的比例。

从学段上看,随着学段的升高,选择评语办法的学生不断增多。
详细来看,各个学段中学生选择笔墨办法的比例都远高于选择音频或***办法的比例。

透过这些评价办法选择的数据表面,我们还对不同评价办法选择对学生评价反思能力的影响进行了进一步的研究。

通过研究,我们认为,首先,方向选择评语办法的学生的评价反思能力更强。
相对付评分办法,评语办法哀求学生在评价活动中更充分地阅读与比较,创造他人作品的上风,更深刻地反思自己的作品。

与此同时,写评语的过程本身就须要学生投入更多的韶光与情绪,这能让学生更好地理解评价的意义,深化对评价过程的代价认同。
当然,这也不虞味着评分办法就全无代价,对付评分这一办法,可以通过设置多维度的评价标准、给出每个等级得分的详细表现性描述等方法,让评分的代价得以更充分的发挥。

其次,上面的调查数据见告我们,在评语办法中,选择笔墨办法的学生远高于选择音频或***办法的学生,这是由平台技能的限定、学生干系履历较少、音***表达办法仍较为浅近等多种缘故原由造成的。

实在,音频或***的评价办法包含的信息量更多,思维交互的层次更深,具有独特的上风。
如何充分发挥音***评价办法的这些上风,让更多的学生考试测验这些新型的评价手段,是今后有待进一步加强的地方。

总的来说,在人工智能时期,评价办法的多样化进一步促进了学习与评价的领悟。
在学评领悟理念下,评价的技能手段包括文本、音频、***、直播***等,评价办法则有评分、星级评价、点赞、评语、代价判断、答题板等。
这些不同的手段、办法,结合学生的特点,经由合理的设计,必将发挥出评价的上风,提升学生的思维层次,促进学习与评价的领悟。

魏宁:这些基于真实评价数据的调查与剖析,我想在某种意义上,是有趣的,更是有代价的,对付在数字化环境下开展教诲评价的西席而言,有着重要的启示。
感谢您为我们分享这些宝贵的研究结论。
末了,关于人工智能时期的教诲评价,您还有若何的期许?

张生:在人工智能时期,我们每个人都生活在两个天下里,在物理天下之外,数字天下里同样有一个我和你。
新型的育情面况一定是物理天下与数字天下共存的,新时期下新的教诲评价体系也一定要打通两个天下,以提升学生高阶思维与核心素养为目标,促进学生的全面发展,为国家培养更多的有用之才。

魏宁:感谢您的分享,让我们共同期待人工智能时期的新型教诲评价体系能成为教诲改革与发展的助推器,为造就未来人才发挥出更大的浸染。

引用请注明参考文献:

张生,魏宁.学评领悟:人工智能时期的教诲评价[J].中国信息技能教诲,2023(19):4-11.