首页 -> 财经 > 财经 > 正文

天天新资讯:商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”

    来源: 巨潮财经网  2023-03-15 10:55:22

3月14日,商汤科技发布多模态多任务通用大模型"书生(INTERN)2.5",在多模态多任务处理能力方面实现了多项全新突破,其卓越的图文跨模态开放任务处理能力可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持,向通用人工智能迈出了坚实的一步。"书生(INTERN)"最初版本由商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学在2021年11月首次共同发布,并持续联合研发。

"书生2.5"拥有30亿参数,不仅是世界上开源模型中ImageNet准确度最高、规模最大的模型,也是物体检测标杆数据集COCO中唯一超过65.0 mAP的模型。目前,"书生2.5"多模态通用大模型已在通用视觉开源平台OpenGVLab开源(https://github.com/OpenGVLab/InternImage),为学术界和产业界的多模态通用模型研发提供有力支撑。


(资料图)

当前,人工智能技术的发展正面临着大量跨模态任务的挑战,为满足快速增长的各式应用场景需求,发展更为通用的人工智能模型已成为科技前沿的核心焦点问题。此次全新发布的"书生2.5"致力于多模态多任务通用模型的构建,可接收处理各种不同模态的输入,并采用统一的模型架构和参数处理各种不同的任务,促进不同模态和任务之间在表示学习方面的协作,逐步实现通用人工智能领域的融会贯通。

迈向AGI通用人工智能,大幅提升通用场景感知和理解能力

在当今快速增长的各式应用场景需求下,传统计算机视觉已无法处理真实世界中数不胜数的特定任务和场景需求。我们迫切需要一种具备通用场景感知和复杂问题处理能力的高级视觉系统。

"书生2.5"实现了通过文本来定义任务,从而可以灵活地定义不同场景的任务需求,并根据给定视觉图像和任务的提示性语句,给出相应的指令或作答,进而具备通用场景下的高级感知和复杂问题处理能力,比如图像描述、视觉问答、视觉推理和文字识别等。

在自动驾驶和居家机器人等通用场景下,"书生2.5"可辅助处理各种复杂任务。例如在自动驾驶场景下,可以大幅提升场景感知理解能力,准确地辅助车辆判断交通信号灯状态、道路标志牌等信息,为车辆的决策规划提供有效信息输入。

利用多模态多任务通用大模型辅助完成自动驾驶场景中各类复杂任务

利用多模态多任务通用大模型辅助完成居家机器人场景中各类复杂任务

除了解决例如自动驾驶和居家机器人这类复杂问题的能力,"书生2.5"通用大模型也可以解决纷繁复杂的日常生活中的常见任务,满足各种需求。

除了全图级别的以图生文,"书生2.5"通用大模型同样可以根据物体边框更精细化定位任务需求。

"书生2.5"同时具备AIGC"以文生图"的能力,可根据用户提出的文本创作需求,利用扩散模型生成算法,生成高质量、自然的写实图像。例如借助"书生2.5"的以文生图能力帮助自动驾驶技术研发,通过生成各类真实的道路交通场景,如繁忙的城市街道、雨天拥挤的车道、马路上奔跑的狗等,生成写实的CornerCase训练数据,进而训练自动驾驶系统对Corner Case场景的感知能力上限。

"书生2.5"还可根据文本快速检索出视觉内容。例如,可在相册中返回文本所指定的相关图像,或是在视频中,检索出与文本描述最相关的帧,提高视频中时间定位任务的效率。此外还支持引入物体检测框,根据文本返回最相关的物体,可实现开放世界视频或图像中物体检测及视觉定位。

三位一体,高效能打通自然语言、图像等多模态任务处理

"书生2.5"在图文跨模态领域卓越的性能表现来自于视觉、语言及多任务建模三大模型能力的有效融合,即InternImage-G通用视觉大模型、用于文本理解的超大语言预训练模型(LLM)和用于多任务的兼容解码建模大模型(Uni-Perceiver)。

其中,InternImage-G通用视觉大模型能够基于动态稀疏卷积算子自适应地调整卷积的位置和组合方式,从而为多功能视觉感知提供强大的表示。超大语言模型通过在超大规模丰富文本语料库上进行预训练提供强大可靠的文本特征。Uni-Perceiver通才任务解码建模通过将不同模态的数据编码到统一的表示空间,将不同任务统一为相同的任务范式,从而能够以相同的架构和共享的模型参数同时处理各种模态和任务。此外,"书生2.5"还创新性地引入了任务级别的稀疏激活机制,使其具备高效的多任务协作能力。

在视觉主流图像分类数据集ImageNet上,该模型仅基于公开数据便达到了90.1%的Top-1准确率。这是除谷歌与微软之外,唯一准确率超过90.0%的模型,值得一提的是,谷歌与微软均未公开模型及额外数据集。"书生2.5"同时也是世界上开源模型中ImageNet准确度最高、规模最大的模型。

除了高精确度的语义理解能力外,"书生2.5"在目标定位性能上同样有着出色的表现。在物体检测标杆数据集COCO上,其取得了65.4的mAP,是世界上唯一超过65.0 mAP的模型。"书生2.5"也在包括图像分类、物体检测、语义分割、图像描述、图文检索等20+个不同场景、不同任务的单模态和跨模态公开数据集中都取得了最佳成绩。

在20余个不同场景、不同任务的单模态和跨模态公开数据集中都取得了最佳成绩

开源模型社区性能最强多模态大模型加速学术和产业界多模态通用模型研发

即日起,"书生2.5"多模态通用大模型已在通用视觉开源平台OpenGVLab开源,成为目前开源模型社区能提供的性能最强的多模态大模型。

OpenGVLab致力于通用视觉模型的开源社区建设,开源项目覆盖数据、模型、评测基准全链路,为学术界和产业界的多模态通用模型研发提供了坚实的支撑。在数据方面,OpenGVLab构建了千万级超大规模精标注数据集,涵盖了图像分类、目标检测等视觉核心任务的标注,同时包括各类图像中的属性、状态等的精细标注,显著降低了数据的采集成本。在模型方面,OpenGVLab的开源项目全方位覆盖了通用模型架构、高效训练框架及超高性能的预训练模型,助力社区用极低的数据量快速满足多场景、多任务、高性能的AI模型训练,并供所有对人工智能技术感兴趣的人士自由体验。

OpenGVLab还提供了多任务、多模态的通用视觉评测基准,可以提供权威的评测结果,推动基于统一标准的公平和准确评测,加快通用视觉模型的产业化应用步伐。通过开源社区的建设,OpenGVLab帮助开发者显著降低通用视觉模型的开发门槛,用更低成本快速开发用于成百上千种视觉任务、视觉场景的算法模型,高效实现对长尾场景的覆盖,推动通用AI技术的规模化应用。

当前,"书生"还在持续学习、不断进步,致力于实现多模态多任务通用模型技术的突破,驱动通用人工智能技术的创新应用生态,为推动人工智能学术、产业发展做出贡献。

免责声明:此文内容为本网站刊发或转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。

标签:

【免责声明】

1、凡本网注明出处非(巨潮财经网)的作品,均转载于自其它媒体,并不代表本网赞同其观点和对其真实性负责,目的在于信息的传递,本网不承担稿件侵权行为的连带责任,如对稿件有质疑请与本网客服联系。

2、刊发此文目的在于传递更多信息,文章内容仅供参考,不构成投资建议,投资者据此操作,风险自担。

3、如涉及作品内容、版权等其它问题,请在15日内联系本网客服。

阅读延展

天天新资讯:商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”

天天新资讯:商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”

3月14日,商汤科技发布多模态多任务通用大模型 "书生(INTERN)2 5 ",在多模态多任务处理能力方面实现了多项全新突破,其...

2023-03-15 10:55:22

赴华签证新调整 入境游利好再加码 视焦点讯

赴华签证新调整 入境游利好再加码 视焦点讯

3月14日,据央视网,外交部领事司发布通告,为进一步便利中外人员往来,决定自北京时间2023年3月15日零时起,就外国人来华签...

2023-03-15 09:35:05

年入30亿卡游被诉侵权“奥特曼” 50倍成本价售卖学生?

年入30亿卡游被诉侵权“奥特曼” 50倍成本价售卖学生?

奥特曼卡牌 "瘾 "忧:赚学生钱财,助攀比之风,不少商家仍在违规售卖文丨新浪财经周文猛近日,年入30亿的 "奥特曼卡牌公司...

2023-03-15 09:46:25

马上消费积极履行社会责任,送金融知识进老年服务站

马上消费积极履行社会责任,送金融知识进老年服务站

2023年3月13日下午,马上消费金融股份有限公司(以下简称马上消费)以 "3 15 "教育宣传周为契机,组织员工前往重庆市渝北...

2023-03-15 09:50:58

2022年公募基金经理离职率为近十年最低|天天观速讯

2022年公募基金经理离职率为近十年最低|天天观速讯

本报记者昌校宇基金经理作为管理基金产品的核心人员,其变动情况备受市场关注。近期,有关基金经理离职的媒体报道较多,《证...

2023-03-15 09:36:30

最近更新

天天新资讯:商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”

天天新资讯:商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”

3月14日,商汤科技发布多模态多任务通用大模型 "书生(INTERN)2 5 ",在多模态多任务处理能力方面实现了多项全新突破,其...

2023-03-15 10:55:22

报告:2022年超7.2亿个密码在网上泄露,72%用户仍在使用之前被泄露密码

报告:2022年超7.2亿个密码在网上泄露,72%用户仍在使用之前被泄露密码

财经网科技3月15日讯,网络安全公司SpyCloud发布了2023年身份暴露报告,揭示了2022年网络数据泄露的严重情况。该报告显示,该...

2023-03-15 10:43:12

中国消费者协会:汽车质量问题频发 如智能辅助驾驶系统失灵

中国消费者协会:汽车质量问题频发 如智能辅助驾驶系统失灵

财经网汽车讯3月15日,据贝壳财经报道,中国消费者协会指出,伴随着人们生活水平的提高,汽车已经成为一种基础交通工具进入寻...

2023-03-15 10:43:14

赴华签证新调整 入境游利好再加码 视焦点讯

赴华签证新调整 入境游利好再加码 视焦点讯

3月14日,据央视网,外交部领事司发布通告,为进一步便利中外人员往来,决定自北京时间2023年3月15日零时起,就外国人来华签...

2023-03-15 09:35:05

广东旅游商务市场再迎利好:港澳地区外国人组团入境广东免签

广东旅游商务市场再迎利好:港澳地区外国人组团入境广东免签

21世纪经济报道记者唐唯珂广州报道外交部领事司微信公众号 "领事直通车 "14日发布,为进一步便利中外人员往来,决定自北京...

2023-03-15 09:32:53

年入30亿卡游被诉侵权“奥特曼” 50倍成本价售卖学生?

年入30亿卡游被诉侵权“奥特曼” 50倍成本价售卖学生?

奥特曼卡牌 "瘾 "忧:赚学生钱财,助攀比之风,不少商家仍在违规售卖文丨新浪财经周文猛近日,年入30亿的 "奥特曼卡牌公司...

2023-03-15 09:46:25

快讯 | Caleres2022财年销售增长6.9%至2.97亿美元

快讯 | Caleres2022财年销售增长6.9%至2.97亿美元

财经网生活讯近日,美国鞋业公司Caleres发布2022财年业绩报告,披露截至2023年1月28日,全年销售额同比增长6 9%至2 97亿美...

2023-03-15 09:49:19

今日关注:快讯 | Guess2023财年收入增长4%至26.9亿美元,Q4销售上涨2%

今日关注:快讯 | Guess2023财年收入增长4%至26.9亿美元,Q4销售上涨2%

财经网生活讯近日,Guess发布2023财年第四季度及全年业绩报告,披露截至2023年1月28日的2023财年收入同比增长4%至26 9亿美元...

2023-03-15 09:55:11

马上消费积极履行社会责任,送金融知识进老年服务站

马上消费积极履行社会责任,送金融知识进老年服务站

2023年3月13日下午,马上消费金融股份有限公司(以下简称马上消费)以 "3 15 "教育宣传周为契机,组织员工前往重庆市渝北...

2023-03-15 09:50:58

前公募老将“再出发” 新国兴私募完成备案-环球微头条

前公募老将“再出发” 新国兴私募完成备案-环球微头条

每经记者李沛沛每经编辑叶峰《每日经济新闻》记者获悉,近日,中基协又公布了一批完成备案的私募基金名单,其中出现了一个熟...

2023-03-15 09:32:45

2022年公募基金经理离职率为近十年最低|天天观速讯

2022年公募基金经理离职率为近十年最低|天天观速讯

本报记者昌校宇基金经理作为管理基金产品的核心人员,其变动情况备受市场关注。近期,有关基金经理离职的媒体报道较多,《证...

2023-03-15 09:36:30

圆信永丰两只基金“续命”遇挫 世界热头条

圆信永丰两只基金“续命”遇挫 世界热头条

来源:每日经济新闻每经记者黄小聪每经编辑赵云近日,圆信永丰旗下两只基金——圆信永丰沣泰混合、圆信永丰丰和中短债基金,...

2023-03-15 09:48:48

全球热消息:郭广昌大动作!复星高科超百亿“清仓”南钢股份

全球热消息:郭广昌大动作!复星高科超百亿“清仓”南钢股份

重磅收购深夜传来!3月14日晚间,南钢股份(600282)披露公告称,间接控股股东复星高科及其一致行动人与沙钢集团及江苏沙钢集...

2023-03-15 09:36:26

墨尔本留学生活锦囊在这里!提前了解莫纳什大学留学住宿

墨尔本留学生活锦囊在这里!提前了解莫纳什大学留学住宿

对于初入墨尔本的留学生来说,提前了解墨尔本当地风情、莫纳什大学周边等信息都至关重要。如果你还没做好规划,一定要提前收...

2023-03-15 09:50:08

旧爱名场面又来了!陈伟霆阿Sa同框,男方临阵脱逃,女方尴尬撞衫 环球今热点

旧爱名场面又来了!陈伟霆阿Sa同框,男方临阵脱逃,女方尴尬撞衫 环球今热点

旧爱名场面又来了!陈伟霆阿Sa同框,男方临阵脱逃,女方尴尬撞衫,成龙,尴尬,撞衫,模特,陈伟霆,阿sa,梁朝伟,刘德华,张学友,周...

2023-03-15 09:10:03

暖心相伴,中荷人寿与您一起守望幸福

近日中荷人寿北京分公司接到客户的家属的一通来电,电话中,客户家属宋先生用耐心、细心、爱心、温暖这些朴实无华的语言,由...

2023-03-15 09:21:58

诺辉健康(06606.HK):成长性持续释放,战略加持下成长路径清晰

诺辉健康(06606.HK):成长性持续释放,战略加持下成长路径清晰

随着疫情阴霾消散,线下市场活动恢复,医药行业的景气度升温,诺辉健康的增长空间还将有望持续释放

2023-03-15 08:59:31

家装业“先款后货”乱象:经销商卷款跑路,消费者13万全款两年没收到货

家装业“先款后货”乱象:经销商卷款跑路,消费者13万全款两年没收到货

付了全款,却迟迟提不了货,正在成为很多全屋定制消费者的新烦恼。一年一度 "3·15消费者权益保护日 "到来之际,黑猫投诉平...

2023-03-15 08:42:27

天天短讯!“内卷”的银行消费贷

天天短讯!“内卷”的银行消费贷

春意盎然、万物生机,伴随着国内消费市场复苏步伐加快,银行 "价格战 "也打得愈发 "内卷 "。下调贷款产品利率、发放优惠...

2023-03-15 08:33:45

“狂飙”的信用卡代还

“狂飙”的信用卡代还

沉寂许久,信用卡代还的 "妖风 "又再次刮了起来。自1985年第一张信用卡诞生以来,信用卡在我国推广的时间也已走过了30多年...

2023-03-15 08:52:58

杭州出大招!落户门槛再降低,放宽这些条件,积分指标调整!多地购房即可落户-世界新消息

杭州出大招!落户门槛再降低,放宽这些条件,积分指标调整!多地购房即可落户-世界新消息

近期,多地放宽落户政策。3月13日,浙江杭州对进一步深化户籍制度改革的实施意见征求意见,其中提出,进一步放开学历落户,35...

2023-03-15 08:54:27

世界热推荐:硅谷银行“闪崩”72小时:有储户落袋为安,但多米诺骨牌效应仍在蔓延

世界热推荐:硅谷银行“闪崩”72小时:有储户落袋为安,但多米诺骨牌效应仍在蔓延

挤兑、闪崩、倒闭、反转、兑付……短短72小时,经营了40年的明星银行硅谷银行(SiliconValleyBank,即SVB) "猛然崩塌 ",...

2023-03-15 08:51:27

家电能效虚标成投诉热门 专家:行业头部企业应带头净化市场

家电能效虚标成投诉热门 专家:行业头部企业应带头净化市场

为满足市场家电消费升级需求,拉动家电上下游关联产业发展,促进绿色智能家电消费,近日全国多地落地绿色智能家电下乡相关政...

2023-03-15 08:31:29

“借道”百亿可转债 中国华融入股光大银行_全球新动态

“借道”百亿可转债 中国华融入股光大银行_全球新动态

证券时报记者谢忠翔光大转债临近摘牌前,中国华融连续斥巨资购入,目的果然指向转股。本周一是光大转债最后一个交易日。当天...

2023-03-15 08:31:41

【时快讯】银行理财市场调查:部分理财产品过往业绩展示“报喜不报忧”

【时快讯】银行理财市场调查:部分理财产品过往业绩展示“报喜不报忧”

本报记者苏向杲杨洁目前,银行理财市场存在哪些对投资者 "不友好 "的现象,哪些环节仍有优化空间? "3·15 "前夕,《证券...

2023-03-15 08:52:29

大尺寸面板价格已上涨 或将持续到第三季度-世界今热点

大尺寸面板价格已上涨 或将持续到第三季度-世界今热点

多位受访的面板业人士认为,基于全球经济复苏、下游需求回暖等因素,今年面板产业整体将从大幅亏损回到盈亏平衡线之上,且行...

2023-03-15 08:47:35

特斯拉在美国佛罗里达申请驳回 Model S 门把手缺陷诉讼案|全球聚看点

特斯拉在美国佛罗里达申请驳回 Model S 门把手缺陷诉讼案|全球聚看点

财经网汽车讯3月15日,据IT之家报道,特斯拉正面临着一场诉讼,原告声称该公司在2014年至2016年的ModelS车辆的门把手有缺陷。...

2023-03-15 08:47:29

每日热点:跑马圈地 精酿啤酒下沉扩产

每日热点:跑马圈地 精酿啤酒下沉扩产

随着酒水销售市场逐渐回升,精酿啤酒也呈现出持续扩容的发展态势。3月14日,北京商报记者梳理了解到,2022-2023年以来,全国1...

2023-03-15 07:37:49

南侨食品高价棕榈油已基本消化 今年冷冻面团高增长能实现吗?

南侨食品高价棕榈油已基本消化 今年冷冻面团高增长能实现吗?

原标题:财报里的真相丨南侨食品高价棕榈油已基本消化今年冷冻面团高增长能实现吗?◎与2021年营收、净利润均创下历史新高的...

2023-03-15 07:36:17