news 2026/4/3 1:40:28

首批!景联文入选杭州语料库高质量数据集建设先行先试清单

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
首批!景联文入选杭州语料库高质量数据集建设先行先试清单

|首批高质量数据集建设先行先试清单的发布,不仅是官方对数据价值的认证,更是景联文科技从数据服务商迈向“AI数据基础设施”的关键一步。

近日,在浙江省数据局指导下,杭州市数据资源管理局联合杭州市数据集团等单位,通过“揭榜挂帅”机制,正式发布首批50个杭州语料库高质量数据集建设先行先试清单。景联文《教育大模型英文知识数据集》成功入选,成为教育教学领域代表性高质量数据产品,标志着公司在教育垂直领域的数据服务能力获得了官方与市场的双重认可

5637万道结构化英文试题,打造教育大模型“黄金语料”

本次入选的《教育大模型英文知识数据集》,是景联文科技历时一年自主研发的行业专用类高质量数据资产。数据集总量超5760万道英文试题,其中:

  • K12英文试题5637万道,覆盖商业、计算机、教育等20+学科,76%配备详细解析;
  • 大学英文试题9.7万道,涵盖英语、数学、生物等19门核心课程,每题均含专业解析;
  • 多模态试题150万道,图像规格不低于768×1024像素,支持图文理解与跨模态训练;
  • 指令微调数据达5637万条提示问答对,重复率<0.05%,专为大模型对齐优化设计。

所有数据采用JSONL结构化格式,字段完整覆盖学科、考点、题型、学段、年级、难度、题干、选项、答案、解析及媒体资源,严格遵循《2025高质量数据集实践指南(1.0)》标准,题目完整度≥95%,答案准确率≥95%。

接入杭州语料库,推动教育数据要素市场化流通

根据杭州市数据资源局政策,首批高质量数据集将通过数据产权确认,接入杭州语料库,面向社会提供创新性、示范性数据服务。此次入选,不仅验证了景联文数据产品的技术领先性,更打通了从“数据资源”到“数据资产”再到“数据产品”的转化路径。

景联文构建了“采集-清洗-标注-质检-迭代”全生命周期治理体系,自研AI治理平台支撑百万级数据日处理能力,已为教育科技公司、出版集团及大模型研发机构提供专项数据服务,助力智能教育生态高质量发展。

景联文也明确了下一步方向:持续提升数据质量至更高标准。并计划向STEM、前沿科技等更高价值学科拓展,构建包含音视频的多模态3.0版本题库,以适配教育大模型更复杂的交互需求。让AI真正赋能因材施教,促进教育公平与质量提升。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/26 10:53:26

【Cirq版本适配终极指南】:解决代码补全失效的5大核心方案

第一章:Cirq代码补全失效的根源剖析 在使用 Cirq 进行量子电路开发时,开发者常依赖 IDE 的代码补全功能提升效率。然而,部分用户反馈在主流编辑器(如 VS Code、PyCharm)中遭遇补全失效问题。该现象并非由单一因素导致&…

作者头像 李华
网站建设 2026/3/28 12:23:43

Mini Pupper四足机器人开发探险指南

Mini Pupper四足机器人开发探险指南 【免费下载链接】QuadrupedRobot Open-Source,ROS Robot Dog Kit 项目地址: https://gitcode.com/gh_mirrors/qu/QuadrupedRobot 🗺️ 欢迎来到机器人开发的未知领域!在这片充满代码与机械的探险地图上&#x…

作者头像 李华
网站建设 2026/3/21 12:45:56

从零搭建高可用边缘Agent系统:必须掌握的3个Docker网络核心技巧

第一章:从零构建边缘Agent系统的背景与挑战随着物联网设备的爆发式增长和5G网络的普及,边缘计算逐渐成为支撑实时数据处理与智能决策的核心架构。在这一背景下,边缘Agent作为连接终端设备与云端控制平台的关键组件,承担着数据采集…

作者头像 李华
网站建设 2026/4/2 6:50:22

2024年快餐数仓 快餐点餐 离线数据仓库项目实战教程

在数据驱动决策成为企业标配的今天,数据仓库(数仓)已不再是大厂专属的“高冷技术”,而是中小团队乃至个人分析师都亟需掌握的核心能力。然而,传统数仓教学常陷入两大误区:要么堆砌理论术语,讲得…

作者头像 李华
网站建设 2026/3/27 23:42:04

ffmpeg-python智能视频质量优化实战指南

ffmpeg-python智能视频质量优化实战指南 【免费下载链接】ffmpeg-python Python bindings for FFmpeg - with complex filtering support 项目地址: https://gitcode.com/gh_mirrors/ff/ffmpeg-python 还在为视频处理中的画质波动而头疼吗?面对复杂的FFmpeg命…

作者头像 李华