珠海都市网
您当前的位置 :首页 > 文传商讯 > 正文
阿联酋技术创新研究所利用新架构革新人工智能语言模型
2024年08月14日 18:07:09来源:作者:
【摘要】 经Hugging Face独立验证,Falcon Mamba 7B是全球性能第一的开源状态空间语言模型(SSLM) SSLM的内存成本低,无需额外内存即可生成任意长文本块 Falcon Mamba 7B还优于传统的Transformer架构模型,如Meta的 Llama 3.1 8B和Mistral的7B 新模型体现了阿布扎比在人

经Hugging Face独立验证,Falcon Mamba 7B是全球性能第一的开源状态空间语言模型(SSLM)
SSLM的内存成本低,无需额外内存即可生成任意长文本块
Falcon Mamba 7B还优于传统的Transformer架构模型,如Meta的 Llama 3.1 8B和Mistral的7B
新模型体现了阿布扎比在人工智能研发领域的创新和开拓精神

阿联酋阿布扎比--(美国商业资讯)--技术创新研究所(TII)是全球领先的科研中心和阿布扎比先进技术研究理事会(ATRC)的应用研究支柱。该研究所发布了Falcon系列中的一款新的大型语言机型——Falcon Mamba 7B。经Hugging Face独立验证,新模型是全球性能第一的开源状态空间语言模型(SSLM)。

本新闻稿包含多媒体。此处查看新闻稿全文: https://www.businesswire.com/news/home/20240812747850/zh-CN/

作为Falcon系列的首款SSLM,它有别于之前所有使用Transformer架构的Falcon模型。新的Falcon Mamba 7B模型是该研究所正在进行的开创性研究及其以开源形式向社区提供突破性工具和产品的又一例证。

ATRC秘书长兼阿联酋总统战略研究和先进技术事务顾问Faisal Al Bannai阁下表示:“Falcon Mamba 7B标志着TII连续第四次获得人工智能模型排名第一,巩固了阿布扎比作为全球人工智能研发中心的地位。这一成就彰显了阿联酋对创新的坚定承诺。”

在Transformer架构模型方面,Falcon Mamba 7B在HuggingFace新引入的基准测试中优于Meta的Llama 3.1 8B、Llama 3 8B和Mistral的7B。同时,在其他SSLM中,Falcon Mamba 7B在旧基准测试中击败了所有其他开源模型,它将成为HuggingFace新的更严苛基准测试排行榜上的第一款模型。

TII首席执行官Najwa Aaraj博士表示:“技术创新研究所继续通过Falcon系列人工智能模型突破技术发展的界限。Falcon Mamba 7B代表了真正的开创性工作,为未来的人工智能创新铺平了道路,这些创新将增强人类的能力并改善生活。”

状态空间模型在理解随时间演变的复杂情况(如一整本书的内容)方面表现极为出色。这是因为SSLM不需要额外的内存来消化如此大量的信息。

另一方面,基于Transformer的模型在记住和使用它们之前处理过的序列信息方面非常高效。这使它们在内容生成等任务中表现出色,然而,由于它们会将每个单词与其他单词进行比较,这就需要大量的计算能力。

SSLM可应用于各种领域,如估计、预测和控制任务。与Transformer架构模型类似,它们在自然语言处理任务中也有出色表现,可应用于机器翻译、文本摘要、计算机视觉和音频处理。

TII人工智能跨中心部门代理首席研究员Hakim Hacid博士表示:“在推出Falcon Mamba 7B之际,我为TII促进其发展的合作生态系统感到自豪。这次发布标志着我们向前迈出了一大步,启发了新的视角,进一步推动了对智能系统的探索。在TII,我们正在突破SSLM和Transformer模型的界限,以激发生成式人工智能领域的更多创新。”

Falcon LLM的下载次数已超过4500万次,证明了该模型的巨大成功。Falcon Mamba 7B将基于TII Falcon License 2.0发布。这是一种基于Apache 2.0的宽松软件许可证,包含一项促进人工智能负责任使用的可接受使用政策。如需了解有关这一新模型的更多信息,请访问FalconLLM.TII.ae。

*来源: AETOSWire

免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。

在 businesswire.com 上查看源版本新闻稿: https://www.businesswire.com/news/home/20240812747850/zh-CN/

CONTACT:

Jennifer Dewan,高级传播总监
Jennifer.dewan@tii.ae

阿联酋技术创新研究所利用新架构革新人工智能语言模型(照片:AETOSWire)

技术创新研究所(TII):性能基准 -(信息图表:AETOSWire)

责任编辑: admin

看新闻,关注新闻

百度网友:楓獨洎薸蓅
评论:何为女流氓?答曰:思想上的女流氓。生活上的好姑娘。外形上的柔情少女。心理上的变形金刚……

其它网友:迷情queen°
评论:在如今这个物价飞涨的时代,只有工资以不变应万变

猫扑网友:Curtain 私念
评论:警察说:"你不知道开车不让打电话吗?"我一脸疑惑的说:"我没打电话呀?.....我发短信来着!"

天猫网友:﹎拿命再愛√
评论:装傻这事,如果干的好,叫大智若愚

搜狐网友:女人要自爱
评论:儿子要穷养,长大了才知道奋斗;女儿要富教,长大了才不会被诱惑。

天涯网友:透支的生活°
评论:真正能阻止离婚的婚姻法是:离婚后房子归国家!

淘宝网友:控魂者*monee
评论:男女中之所以有纯洁的友谊,是因为女生长得不够漂亮

网易网友:゛风骚, - /ov3
评论:每次听到有人在吆喝回收废品我就想到把你卖了。

腾讯网友:埖了妝女人
评论:生活之所以有回忆,不是因为突然想起,而是因为不能忘记!

凤凰网友:不三姑娘 #
评论:我们这个年龄,更多的是练爱而不是恋爱。

相关阅读
分享到:
版权和免责申明

珠海都市网所有文字、图片、视频、音频等资料均来自互联网,不代表本站赞同其观点,本站亦不为其版权负责。相关作品的原创性、文中陈述文字以及内容数据庞杂本站无法一一核实,如果您发现本网站上有侵犯您的合法权益的内容,请联系我们,本网站将立即予以删除!