推荐关注:

总裁的小护士中国电信进一步开源12B星辰大模型

收集整理:九站网 更新时间:2024-04-28 11:38 文章来源:每日看点快看

总裁的小护士本文转自:德宏团结报X能提升30%!中国电信进一步开源12B星辰大模型本报讯近日,中国电信开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源

原标题:《中国电信进一步开源12B星辰大模型》

总裁的小护士本文转自:德宏团结报

总裁的小护士X能提升30%!

总裁的小护士中国电信进一步开源12B星辰大模型

总裁的小护士本报讯近日,中国电信开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源7B版本,内容、X能和应用等方面整体效果提升30%,其中,多轮推理、安全问题等领域提升超40%。在C-eval、MMLU、AGIEVAL等国际权威榜单上,排名处于国内同级别参数开源模型的前列,进一步促进大模型开源生态繁荣,助力AI产业加速高质量发展。另悉,中国电信将于年内开源千亿级参数大模型。

总裁的小护士中国电信人工智能研究院坚持自研自主,加快研发创新,不断优化底层模型结构,解除WordEmbedding与lmhead共享参数,有效提升模型稳定X和训练效果,并基于精细化的CheckPoint效果验证,进行动态的数据配比优化调整,大幅提升模型训练效果。

总裁的小护士海量高质量数据是保证大模型效果的基础,TeleChat-12B将7B版本1.5T训练数据提升至3T,优化数据清洗、标注策略,持续构建专项任务SFT(监督微调)数据,优化数据构建规范,大大提升数据质量。同时,基于电信星辰大模型用户真实回流数据,优化奖励模型和强化学习模型,有效提升模型问答效果。

总裁的小护士中国电信人工智能研究院通过更彻底地开源,推动大模型技术进步和大模型国产化进程。据了解,此次开源可提供基础模型以及基于相应版本的对话模型、不仅支持传统的全量参数更新还支持LoRA等只更新部分参数的高效微调方法、支持Deepspeed微调、支持int8、int4量化和国产芯片训练推理,推动大模型国产化进程。

总裁的小护士加速探索创新的同时,星辰大模型也在深入推动人工智能与各行各业的融合,积极探索新兴的应用场景。星辰语义大模型已应用于行文写作、*码编程、网络故障分析以及经营分析等场景。以行文写作为例,其平均生成字数超过1500字,有效采纳率达到85.7%。在对外企事业单位客户的业务中,星辰语义大模型支持企业经营分析、政务公开咨询、民生诉求接待等场景,可覆盖95%的实际业务场景,多轮理解准确率达到90%。除传统行业应用场景,星辰大模型还积极探索前沿领域应用,解决无人机编排投入多、开发量大的问题,实现无人机智能编排轻量化建设。

总裁的小护士目前,星辰大模型已广泛应用落地,赋能千行百业转型升级。客服大模型在全国试点上线18个服务场景,充分赋能智慧客服和数字人,在激活十亿级的日志、百亿级的网络参数等海量数据资产的基础上,进一步深化智能化运营。(中国电信德宏分公司)

总裁的小护士本文转自:德宏团结报总裁的小护士X能提升30%!总裁的小护士中国电信进一步开源12B星辰大模型总裁的小护...

阅读全文

띲띪띺总裁的小护士中国电信进一步开源12B星辰大模型》一文由九站智能AI收集整理,不代表本站支持其观点
如无意侵犯您的权益,请及时与我们联系,我们将在第一时间处理您的诉求。

热门频道推荐 建站经验 策划盈利 搜索优化 业界动态 境外动态 网络评论 传媒播报 产品运营 交互设计 网站推广 免费资源 网络游戏 网页游戏 电商要闻 电商分析 移动通讯 数码咨讯 移动应用 数码评测 创业模式 创业资本 创业点评 创业经验 电商淘客 电商微商

九站草根门户 服务草根站长 集结网络群体的力量!
免责申明:本站为非盈利性网站,不刊登或转载任何完整的新闻内容,其版权归原作者所有。如无意侵犯您的权益,请及时与我们联系,我们将在第一时间处理您的诉求。
PHP程序订制开发,九站系统销售联系QQ 1142088012 蜀ICP备06021074号-10 Copyright 2011-2022 © Www.O9z.Net .All Rights Reserved