昆仑万维开源130亿参数大模型,0门槛商用、多榜(2)
时间:2023-11-02 05:10 来源:网络整理 作者:墨客科技 点击:次
4)最大中文开源数据集之一:将配套开源600GB、150B Tokens的高质量中文语料数据集Skypile/Chinese-Web-Text-150B。开发者可以最大程度地借鉴技术报告中大模型预训练的过程和经验,深度定制模型参数,有针对性的进行训练与优化。 5)最有诚意的开源商用:全面开放商用许可,将授权流程做到极简,取消对行业、公司规模、用户等方面的限制,用户在下载模型并同意并遵守《Skywork模型社区许可协议》后,无需再次申请授权,即可将大模型进行商业用途。 目前开源社区中的中文大模型多数并非是完全可商用,用户通常需要进行复杂的商用授权申请流程,有些情况会对公司规模、所在行业、用户数等维度有明确规定不给予商业授权。 昆仑万维希望用户能够更便捷地探索Skywork-13B系列大模型技术能力,探索在不同场景下的商业化应用,以帮助更多对中文大模型感兴趣的用户和企业在行业中不断探索和进步。 03. 形成六大AI业务矩阵, 以All in AGI与AIGC为战略重心 昆仑万维成立于2008年,从游戏起家,2015年在深交所上市,2020年便已开始布局AIGC领域,正全面构建多元化的业务生态。 至今,昆仑万维已积累近三年的相关工程研发经验,并建立了行业领先的预训练数据深度处理能力,在AI领域已形成AI大模型、AI搜索、AI游戏、AI音乐、AI动漫、AI社交六大AI业务矩阵。 All in AGI与AIGC是昆仑万维的战略。 据了解,昆仑万维董事长兼CEO方汉是很早参与到开源生态建设的开源老兵,也是中文Linux开源最早的推动者之一,因此开源精神和AIGC技术发展的结合将会贯穿于昆仑万维战略之中。 今年以来,昆仑万维一路快马加鞭,释出从基础大模型到AIGC产品的一系列进展: 4月17日,昆仑万维发布自研千亿级大语言模型「天工3.5」,并启动邀请测试。该模型具备文案创作、知识问答、代码编程、逻辑推演、梳理推算等多元AI生成能力。 5月19日,北京市经济和信息化局公布第一批《北京市通用人工智能产业创新伙伴计划成员名单》,昆仑万维成为第一批模型伙伴和投资伙伴。 8月23日,昆仑万维发布国内第一款AI搜索产品——天工AI搜索,并开启内测申请。天工AI搜索通过人性化、智能化的方式全面提升用户的搜索体验,并集成AI对话、AI写作等常用功能,帮助用户提高中文搜索体验和工作效率。 9月1日,计算机视觉和机器学习领域的国际顶级专家颜水成教授正式加盟昆仑万维,与昆仑万维创始人周亚辉一起出任天工智能联席CEO,并兼任昆仑万维2050全球研究院院长,负责前沿技术的研究。 9月5日,昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型测评MME中,综合得分排名第一。 9月17日,昆仑万维通过信通院“可信AI”评估,并被评选为人工智能实验室副组长单位。 9月25日,昆仑万维正式控股AI大算力芯片企业艾捷科芯,布局AI芯片。 10月26日,天工大模型获得由北京算法交易服务中心颁发的“算法模型认证证书”,昆仑万维成为北京算法交易服务中心首批认证企业。 今天,天工Skywork-13B系列大模型的开源,标志着昆仑万维持续投资AGI生态的决心。 04. 结语:推动开源生态繁荣, 加速AI技术落地 蓬勃发展的开源生态建设是构建AI和应用融合的重要一环。持续降低模型的研发门槛、使用成本、最大化的共享技术能力和经验,有助于加速AI应用普及,促使更多的企业和开发者们参与到AI引领的科技变革中。 昆仑万维表示Skywork-13B系列大模型的开源将为大模型的场景应用和开源社区发展提供最佳的技术支持,加速开源生态繁荣,进而降低大模型商业门槛,推动AI技术落地千行百业。 原标题:《昆仑万维开源130亿参数大模型!0门槛商用、多榜超Llama 2,预训练数据也开源》 (责任编辑:admin) |