晨鸿信息数字版databricks推出开源ai模型dbrx

收集整理：九站网更新时间:2024-03-29 05:36 文章来源：浅语科技

晨鸿信息数字版3月28日消息，初创公司Databricks近日发布公告，推出了开源AI模型DBRX，声称是迄今为止全球最强大的开源大型语言模型，比Meta的Llama2更为强

原标题:《databricks推出开源ai模型dbrx》

晨鸿信息数字版3月28日消息，初创公司Databricks近日发布公告，推出了开源AI模型DBRX，声称是迄今为止全球最强大的开源大型语言模型，比Meta的Llama2更为强大。

晨鸿信息数字版

晨鸿信息数字版DBRX采用transformer架构，包含1320亿参数，共16个专家网络组成，每次推理使用其中的4个专家网络，激活360亿参数。

晨鸿信息数字版Databricks在公司博客文章中介绍，在语言理解、编程、数学和逻辑方面，对比Meta公司的Llama2-70B、法国MixtralAI公司的Mixtral以及马斯克旗下xAI开发的Grok-1等主流开源模型，DBRX均优势胜出。

晨鸿信息数字版

晨鸿信息数字版图1：DBRX在语言理解(MMLU)、编程(H..umanEval)和数学(GSM8K)方面的表现优于已有的开源模型。

晨鸿信息数字版在语言理解方面，DBRX的分值为73.7%，高于GPT-3.5的70.0%、高于Llama2-70B的69.8%、Mixtral的71.4%以及Grok-1的73.0%。

晨鸿信息数字版模型

晨鸿信息数字版DBRXInstruct

晨鸿信息数字版MixtralInstruct

MixtralBase

LLaMA2-70BChat

LLaMA2-70BBase

Grok-11

OpenLLMLeaderboard2

(Avgofnext6rows)

74.5%

72.7%

68.4%

62.4%

67.9%

—

ARC-challenge25-shot

68.9%

70.1%

66.4%

64.6%

67.3%

—

H..ellaSwag10-shot

89.0%

87.6%

86.5%

85.9%

87.3%

—

MMLU5-shot

73.7%

71.4%

71.9%

63.9%

69.8%

73.0%

TruthfulQA0-shot

66.9%

65.0%

46.8%

52.8%

44.9%

—

WinoGrande5-shot

81.8%

81.1%

81.7%

80.5%

83.7%

—

GSM8kCoT5-shotmaj@13

66.9%

61.1%

57.6%

26.7%

54.1%

62.9%(8-shot)

Gauntletv0.34

(Avgof30+diversetasks)

66.8%

60.7%

56.8%

52.8%

56.4%

—

H..umanEval5

0-Shot,pass@1

(Programming)

70.1%

54.8%

40.2%

32.2%

31.0%

63.2%

在编程能力方面，DBRX的得分为70.1%，远超GPT-3.5的48.1%，高于Llama2-70B的32.3%、Mixtral的54.8%以及Grok-1的63.2%。

Model

DBRX

Instruct

GPT-3.57

GPT-48

Claude3H..aiku

Claude3Sonnet

Claude3Opus

Gemini1.0Pro

Gemini1.5Pro

MistralMedium

MistralLarge

MTBench(Inflectioncorrected,n=5)

8.39±0.08

—

8.41±0.04

8.54±0.09

9.03±0.06

8.23±0.08

—

8.05±0.12

8.90±0.06

MMLU5-shot

73.7%

70.0%

86.4%

75.2%

79.0%

86.8%

71.8%

81.9%

75.3%

81.2%

H..ellaSwag10-shot

89.0%

85.5%

95.3%

85.9%

89.0%

95.4%

84.7%

92.5%

88.0%

89.2%

H..umanEval0-Shot

pass@1

(Programming)

70.1%

temp=0,N=1

48.1%

67.0%

75.9%

73.0%

84.9%

67.7%

71.9%

38.4%

45.1%

GSM8kCoTmaj@1

72.8%(5-shot)

57.1%(5-shot)

92.0%(5-shot)

88.9%

92.3%

95.0%

86.5%

(maj1@32)

91.7%(11-shot)

81.0%(5-shot)

WinoGrande5-shot

81.8%

81.6%

87.5%

—

88.0%

86.7%

在数学方面，DBRX的得分为66.9%，高于GPT-3.5的57.1%，也高于Llama2-70B的54.1%、Mixtral的61.1%和Grok-1的62.9%。

Databricks介绍，DBRX是一个基于MegaBlocks研究和开源项目构建的混合专家模型(MoE)，因此每秒输出token的速度极快。Databricks相信，这将为MoE未来最先进的开源模型铺平道路。

晨鸿信息数字版3月28日消息，初创公司Databricks近日发布公告，推出了开源AI模型DBRX，声称是迄今为止全...

阅读全文

띲띪띺 《晨鸿信息数字版databricks推出开源ai模型dbrx》一文由九站智能AI收集整理，不代表本站支持其观点
如无意侵犯您的权益，请及时与我们联系，我们将在第一时间处理您的诉求。

热点中关村U30启动2024年度招募选拔新增未来产业方向智慧建筑时代：互联网技术引领建筑革新最高奖金20万元！烟台市第六届“市长杯”工业设计大赛邀你报名正装专家金利来以科技创新促进新质生产力发展电池健康检测进社区为居民电动自行车深度“体检”iPhone16 Pro好消息，两大升级亮点曝光鸿蒙4.2+生产力，华为大尺寸平板降价了，重回发布时价格直击2024中国移动算力网络大会展区：算网“X科技”精彩亮相网络文学用户规模达5.2亿人中华优秀传统文化成为创作热点刘慈欣：人工智能等前沿科技为科幻文学提供更多可能外星人真的有超高科技吗？2024中国移动算力网络大会盛大开幕从玉兔号到祝融号，中国星球车故事新华全媒+丨2024中关村论坛年会展现中外科创交流合作新动向全画幅版GX9？松下或在5月发布类旁轴造型的新微单中央网信办部署开展“清朗·打击违法信息外链”专项行动多彩宝入选华为鸿蒙生态软件先锋服务商华为WATCH. 4 Pro太空探索版致敬先驱在线征集600名AI展演体验官！“白泽的奇幻旅程”即将上演

友情链接

九站草根门户服务草根站长集结网络群体的力量！
免责申明：本站为非盈利性网站，不刊登或转载任何完整的新闻内容，其版权归原作者所有。如无意侵犯您的权益，请及时与我们联系，我们将在第一时间处理您的诉求。
PHP程序订制开发，九站系统销售联系QQ 1142088012 蜀ICP备06021074号-10 Copyright 2011-2022 © Www.O9z.Net .All Rights Reserved