网站首页

联系我们

企业登录

免费注册

首页

产品

ios开云手机

方案

标讯

技术

ios开云

技术应用

热门关键词：

智慧治理

北京法安网络文化传媒有限公司

智慧检务

智慧司法

智慧戒毒

智慧城市

智慧公安

智慧戒毒

供需中心

当前位置：首页 > 技术应用 > 技术动态 > 正文

OpenAI推出两套多模态人工智能系统模型

时间：2021-01-11 16:27:58 来源：人工智能实验室

[内容导读] DALL-E可以将以自然语言形式表达的大量概念转换为恰当的图像，并使用了GPT-3 同样的方法，只不过DALL-E将其应用于文本-图像对。

　　据外媒，知名机器学习公司OpenAI近日推出两套多模态人工智能系统模型DALL-E和CLIP，DALL-E可以基于文本直接生成图像，CLIP能够完成图像与文本类别的匹配。DALL-E可以将以自然语言形式表达的大量概念转换为恰当的图像，并使用了GPT-3 同样的方法，只不过DALL-E将其应用于文本-图像对。

　　另一个神经网络CLIP能够执行一系列视觉识别任务。给出一组以语言形式表述的类别，CLIP能够立即将一张图像与其中某个类别进行匹配，而且它不像标准神经网络那样需要针对这些类别的特定数据进行微调。在ImageNet基准上，CLIP的性能超过ResNet-50，在识别不常见图像任务中的性能远超ResNet。

　　虽然CLIP在识别常见对象时往往表现良好，但在计算图像中对象数量等更抽象或更系统的任务，以及预测照片中最靠近车辆间的距离等更复杂任务上的表现不佳。在这两项任务上，zero-shot CLIP的效果也只比随机猜测好一点。

　　责任编辑：大壮

声明:

凡文章来源标注为"智领安平行业网"的文章版权均为本站所有，如需转载请务必注明出处为"智领安平行业网"，违反者本网将追究相关法律责任。非本网作品均来自互联网并标明了来源，如出现侵权行为，请立即与我们联系，待核实后，我们将立即删除，并向您致歉。

您可能感兴趣的文章

活动专题

2023政法展江苏巡展

今日推荐

品牌推荐更多>>

联系我们

客服电话：010-67046081

客服QQ：195024562

商务合作：195024562@qq.com

寻求报道：195024562@qq.com
关于安平行业网

关于我们

诚聘英才

友情链接
免费服务

软文宣传

产品宣传

商铺平台
智领安平行业网移动端

WeChat ID:anpcn.com
微信公众号

WeChat ID:anpcn.com
智领安平行业网小程序

WeChat ID:anpcn.com

版权所有：北京法安网络文化传媒有限公司京ICP备案18035954号-2

京公网安备 11010602007722号