4

阿里云开源70亿参数通义千问大模型

 9 months ago
source link: https://www.jiemodui.com/N/136762.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

阿里云开源70亿参数通义千问大模型

作者:LAN 发布时间: 2023-08-04 14:55

微信图片_20230607123952.jpg
图源:Pixabay

芥末堆文 近期,Meta发布免费且可商用的大模型系列——Llama 2。8月3日,阿里云开源通义千问70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均已上线AI模型社区魔搭 ModelScope ,且两款模型都是开源、免费、可商用的。

据悉,魔搭ModelScope为阿里巴巴达摩院模型开源社区,阿里云成为国内首个加入大模型开源行列的大型科技企业。

今年4月,阿里云推出自研大模型通义千问,据科技媒体介绍,Qwen-7B是基于Transformer的大语言模型,在超大规模预训练数据上训练得到。预训练数据包括大量网络文本、专业书籍、代码等。它是支持中、英等多种语言的基座模型,在超过2万亿 token 数据集上训练,上下文窗口长度达到8k;Qwen-7B-Chat是基 Qwen-7B基座模型的中英文对话模型,已实现与人类认知对齐。

根据魔搭ModelScope社区消息,上个月,智谱AI及清华KEG实验室发布允许ChatGLM-6B和ChatGLM2-6B完全免费商用,希望为开源社区发展作出贡献,为此,在中国中文信息学会社会媒体处理专委会的支持下,智谱AI及清华KEG实验室联合安硕信息、阿里云、魔搭社区、北京交通大学,推出了“ChatGLM金融大模型挑战赛”。比赛要求参赛选手以ChatGLM2-6B模型为中心制作一个问答系统,回答用户的金融相关的问题,不允许使用其他的大语言模型。

据悉,近日腾讯自研的 “腾讯混元大模型”也已经进入应用内测阶段,腾讯内部多个业务已经接入混元大模型进行测试。

1、本文是 芥末堆网原创文章,转载可点击 芥末堆内容合作 了解详情,未经授权拒绝一切形式转载,违者必究;
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章,只呈现有价值的内容给读者;
3、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。

来源: 芥末堆

芥末堆商务合作:010-5726 9867

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK