欢迎来到启牛文库网! | 帮助中心 知识改变命运,上传文档,获取收益!上传文档QQ群:387200517 — 邀人有奖!
启牛文库网
全部分类
  • 办公文档>
    办公文档
    总结报告 心得体会 工作范文 工作计划 解决方案 会议纪要 述职报告 事务文书 模板表格 调研报告 经验事迹 规章制度 招标投标 理论文章 礼仪庆典 活动策划 求职简历 演讲稿致辞 Excle表格 其它办公文档
  • 教育资料>
    教育资料
    幼儿教育 小学教育 初中教育 高中教育 大学教育 考研资料 教学教案 教学课件 教学研究 教育范文 考试资料 小学作文 初中作文 高中作文 精品作文 培训教程 培训教材 职业教育 成人自考 外语文库 认证考试 手抄板报 其它教育文档
  • PPT专区>
    PPT专区
    PPT模板 PPT素材 总结计划 企业培训 教育课件 述职竞聘 党政军警 商业策划 融资路演 高端商务 工作办公 政府汇报 医学医疗 毕业答辩 节日庆典 演讲培训 餐饮美食 唯美清新 中国风格 行业数据 旅游生活 其它PPT模板
  • 建筑工程>
    建筑工程
    建筑规范 建筑设计 建筑施工 工程图纸 工程造价 水利工程 路桥工程 园林设计 室内设计 结构设计 电力电气 暖通空调 勘察测绘 给排水 钢结构 房地产 其它工程文档
  • 企业管理>
    企业管理
    企业文化 薪酬管理 合同协议 人力资源 绩效管理 创业孵化 招商加盟 商业计划 市场营销 企划宣传 资本运营 财务报表 商务礼仪 项目管理 其它管理文档
  • 行业资料>
    行业资料
    标准规范 人文社科 法律文献 工业制造 IT网络 医药卫生 农林牧渔 自然科学 金融证券 旅游娱乐 食品饮料 家居家电 其它行业资料
  • 生活休闲>
    生活休闲
    科普知识 励志创业 婚嫁育儿 家居装修 户外运动 美食烹饪 摄影摄像 文化艺术 网络生活 服装配饰 星座运势 宗教风水 美容塑身 娱乐时尚 保健养生 两性情感 时政新闻 社会民生 琴棋书画 游戏攻略 留学签证 手工制作 滑稽幽默 宠物驯养 其它百科知识
  • 百家杂谈>
    百家杂谈
  • ImageVerifierCode 换一换
    首页 启牛文库网 > 资源分类 > PDF文档下载
    分享到微信 分享到微博 分享到QQ空间

    AGI(通用人工智能)专题之二:“文心一言”发布国内厂商距离复现ChatGPT有多远?

    • 资源ID:2608254       资源大小:2.24MB        全文页数:20页
    • 资源格式: PDF        下载积分:2积分
    快捷下载 游客一键下载
    账号登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    下载资源需要2积分
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    开通VIP享超值特权
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    AGI(通用人工智能)专题之二:“文心一言”发布国内厂商距离复现ChatGPT有多远?

    1、请仔细阅读在本报告尾部的重要法律声明 “文心一言”发布,国内厂商距离复现 ChatGPT 有多远?AGI(通用人工智能)专题之二 “文心一言”表现一如预期,不必过度悲观 3 月 16 日“文心一言”发布,从官方 demo 来看,文心一言具备文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成能力,存在超预期亮点,但事前录屏降低了其演示的真实性,也并未对外直接开放,多因素导致公众反馈不佳。我们认为尽管上下文理解、语义逻辑、多轮对话方面尚有欠缺,“文心一言”展现了足够的文案创作能力,为 B 端降本增效的起始逻辑已经明晰,尽管尚未对公众大范围开放,企业用户已经能够申请内测邀请码,若邀请范围持续

    2、扩大,飞轮效应将推进“文心一言”表现改善,且优化空间极大。复现 ChatGPT 的难点在哪里?AI 三要件略逊一筹,但差距并非不可逾越 1)算法上,去开源化极大增加了国内科技企业的复现难度,但学术界已有相对成功复现先例,随着人才流动、时间推移和研究进步,大模型性能很可能逐渐趋同。2)数据上,数据集质量、标注细节处理、用户真实交互是关键,尽管优质的中文标注数据集匮乏,使用英文数据进行预训练并不影响中文输出,科技企业能够参考 GPT3 的路径,利用海量用户交互提升数据质量。3)算力上,国内头部科技企业多已完成数据中心建设,能够实现算力资源部分自给,此外算力更接近于自由流通的商品,战略押注意愿明确、

    3、现金流充沛的国内厂商有希望弥合算力上的差距。工程化和应用分发能力是隐形壁垒,头部厂商优势明显 国产 ChatGPT 的落地在技术准备之外还需要两项核心要素:工程化与分发能力。1)工程化能力,即能够利用更低的成本和更高效的迭代做出先进的大模型应用,制作更高效、廉价、贴合市场的产品,能够同时容纳亿级用户在线。2)充沛的 C 端用户及 B 端应用场景,即更低的分发触达成本、更快速的产品应用迭代。国内厂商完全具备大 DAU 场景下 AI 工程化处理的潜力,且应用分发是国内企业的长项,头部厂商本身已经建起规模及心智壁垒,且商业模式无需再探索,如要落地 AGI 相关应用,获客成本远低于新进入者。若“文心一

    4、言”对外开放,增量成本仍可控 短期我们关注“文心一言”等产品对科技企业财务状况的影响,将增量成本拆分为训练成本、推理成本及数据标注成本(暂不考虑人力支出及维护费用),测算大模型落地搜索页面后年均增量成本约为 16 亿元。但考虑到国产模型参数量及数据集 token 数量均是未知,且 Azure 云计算价格与实际成本存在偏差,此外实际落地后各项成本均存在优化可能、具体会计处理方式还存在探讨空间,我们判断 10-20 亿元为其增量成本的合理范围(暂不考虑人力支出及维护费用),参评级及分析师信息 行业评级:推荐 行业走势图 分析师:赵琳 邮箱: SAC NO:S1120520040003 -19%-1

    5、3%-7%-2%4%10%2022/032022/062022/092022/122023/03传媒沪深300证券研究报告|行业深度研究报告 仅供机构投资者使用 Table_Date 2023 年 03 月 17 日 证券研究报告|行业深度研究报告 请仔细阅读在本报告尾部的重要法律声明 219626187/21/2019028 16:59考百度 2022 年经营现金流净额 261.7 亿元,对公司正常经营影响可控。投资建议 GPT4、Office365(Copilot)对公众的震撼只是前期技术突破后的余韵,而非 AGI 领域想象力的终点,产品的成功会驱动更多学术资源与产业投资的倾斜,人工智能必

    6、然成为产业发展长期主线,国产替代具有需求上的紧迫性。依然重点推荐百度(BIDU.US),判断“文心一言”表现符合预期,公司目前仍处于低估区间,尽管技术差距依然存在,短期内研发投入可能上行,我们看好人工智能领域投入对公司业绩及估值的长线提振。同时关注已在视频、营销、阅读等相关细分领域抢跑的重点标的,推荐当虹科技、捷成股份、蓝色光标、风语筑、浙文互联。风险提示“文心一言”落地效果不及预期风险;ToB 服务推进节奏不及预期风险;成本大幅增长风险;AI 产品道德及监管风险。证券研究报告|行业深度研究报告 请仔细阅读在本报告尾部的重要法律声明 319626187/21/2019028 16:59正文目录

    7、 1.“文心一言”答卷未知,但国产替代并不遥远.4 1.1.细究算法、数据、算力三要件,略逊一筹但仍有追平可能.5 1.2.工程化处理与分发能力是更高的壁垒.10 1.3.商业化路径已经明晰,搜索场景鲜明契合.12 2.若“文心一言”成功对公众开放,年化增量成本可控.15 2.1.训练:前期固定投入较大,莱特定律驱动下成本必然下行.15 2.2.推理:与用户数量成正比,成本优化路径明确.16 2.3.数据标注:取决于人力价格,成本量级较低.17 3.投资建议.18 4.风险提示.18 图表目录 图 1“文心一言”生成图片.4 图 2“文心一言”生成视频.4 图 3 2005 年起中国 AI 论

    8、文总数超美国.5 图 4 海外 AI 机构预测中国高引论文占比将超过美国.5 图 5 类 ChatGPT 产品的技术发展示意图.5 图 6 ChatGPT 的技术突破点在于引入了 RLHF(基于人类反馈的强化学习).6 图 7 主流大模型数据集来源可分为六类.8 图 8 各类数据来源大小.8 图 9 全球前十大科技企业数据中心容量排名.9 图 10 百度昆仑一、二代芯片与英伟达 A100 参数对比.9 图 11 2013 年起公司资本开支及经营现金流情况.10 图 12 2013 年起公司现金及现金等价物充沛(亿元).10 图 13 AGI 产业链及底层支撑示意图.10 图 14 未接入 GP

    9、T4 的 Bing 仅对搜索结果进行简单整合.12 图 15 NewBing 的 Chat 入口可以对搜索结果进行人性化整合.12 图 16 NewBing 能够帮助用户编写代码.13 图 17 NewBing 能够帮助用户进行文件阅读.13 图 18 New Bing 发布次日 Bing 下载量猛增 758%.13 图 19 百度知识图谱的首要应用场景即为搜索.13 图 20 用户输入“宝可梦朱紫”后出现游戏购买链接.14 图 21 用户输入健美运动员姓名后出现健身补剂广告.14 表 1 Github 社区中主流 AI 框架情况(2022.1).6 表 2 类 ChatGPT 模型年均训练成

    10、本测算.15 表 3 类 ChatGPT 应用中期年均推理成本测算.16 表 4 类 ChatGPT 应用中期年均成本测算.17 证券研究报告|行业深度研究报告 请仔细阅读在本报告尾部的重要法律声明 419626187/21/2019028 16:591.“文心一言”答卷未知,但国产替代并不遥远3 月 16 日百度 AI 对话模型“文心一言”发布,我们据发布会信息总结,“文心一言”基于此前 ERNIE 大模型、PLATO 对话模型训练而成,是对百度 2019 年起便已开始的 NLP 实践的延续。从技术角度看,除百度已有的知识增强、检索增强、对话增强技术外,“文心一言”引入了有监督的精调、RLH

    11、F(基于人类反馈的强化学习)、提示学习等ChatGPT 基础技术,但具体参数量、数据量、耗能、对话时效等均未公开。事前录屏而非实机演示,对外界信心产生负面影响。从现场发布的 demo 来看,文心一言具备文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成能力,同类问题下中文理解能力强于 GPT4,且随输入内容生成音频、视频尚属 AI 对话模型中的首例,存在超预期亮点,但发布会未能展示模型的编程能力,且事前录屏降低了其演示的真实性,也并未对公众开放,多种因素导致公众反馈不佳。“文心一言”展现了足够的文案创作能力,为 B 端降本增效的起始逻辑已经明晰。出于商业角度考虑和高昂的端侧微调成本,厂

    12、商普遍放弃开源,转而以提供 API的方式供下游用户在特定场景下进行推理使用。以 ChatGPT 为例,OpenAI 并未公布其基础模型(GPT3.5、GPT4)技术细节,用户仅能够在自身应用内通过API调用其模型。从第一批用户实际使用来看,“文心一言”已经展示了基础文案工作能力,除此前接入 650 家企业外,发布当日有 6.5 万家企业申请测试,签约 5 家客户,一定程度反映了企业客户的认可程度。用户交互能够进一步改善模型表现,我们判断这也是公司急于推动模型面世的原因之一。OpenAI 自 GPT-3 便开始对外提供服务,通过开放给公众,GPT3 收集来自用户输入内容的多样性数据,从而迭代出效

    13、果更好的模型,这就决定了 GPT4 是站在用户交互飞轮的巨人肩膀上,与文心一言并不在同一起跑线。但是海量用户群也是百度的长处之一,GPT 的飞轮效应是可复制的。尽管尚未对公众大范围开放,企业用户已经能够申请内测邀请码,邀请范围若持续扩大,飞轮效应将推进“文心一言”表现改善,且优化空间极大。我们判断,尽管上下文理解、语义逻辑、多轮对话方面尚有欠缺,“文心一言”在部分问题处理上已经能够对标 GPT3 水平,但具体表现仍需时间和公众验证。我们依然认为,人工智能必然成为产业发展长期主线,国产替代具有需求上的紧迫性。以“文心一言”发布为契机,我们重点分析国内主流科技企业在复现 ChatGPT 领域需要克

    14、服的差距,判断对国产大模型的发展不必过度悲观。图 1“文心一言”生成图片 图 2“文心一言”生成视频 资料来源:百度,华西证券研究所 资料来源:百度,华西证券研究所 证券研究报告|行业深度研究报告 请仔细阅读在本报告尾部的重要法律声明 519626187/21/2019028 16:591.1.细究算法、数据、算力三要件,略逊一筹但仍有追平可能 1.1.1.算法:核心差距在于方法及细节处理大模型的技术积累已经行至一个质变节点。我们将 NLP(自然语言处理)及 CV(计算机视觉)技术视作类 ChatGPT 产品的技术底座,从深度学习的角度分析其发展历程,残差网络及 Transformer 的出现

    15、使得模型的深度和参数量指数级增加,大模型成为可能;大语言模型出现后,大模型的使用方式从预训练的单一任务模型迭代到多模态模型,微调时所需的标注数据量显著减少,从而降低了业务的使用成本。国内 AI 领域积累深厚,历年论文发表及专利申请占优。Elsevier 数据显示 2012-2021 年中国 AI 相关论文篇数始终排在首位,到 2021 年增至美国 2 倍。从论文引用次数进入前 10的篇数来看,中国 2019 年跃居首位。2021 年达到比美国多 7 成的7401 篇;斯坦福大学数据显示2021 年中国提交的人工智能专利申请全球占比超50%。图 3 2005 年起中国 AI 论文总数超美国 图

    16、4 海外 AI 机构预测中国高引论文占比将超过美国 资料来源:Wired,华西证券研究所 资料来源:Allen Institute for AI,华西证券研究所 图 5 类 ChatGPT 产品的技术发展示意图 资料来源:公开资料整理,华西证券研究所 证券研究报告|行业深度研究报告 请仔细阅读在本报告尾部的重要法律声明 619626187/21/2019028 16:59从基本操作系统看,国内已经具备建立 AI 底层框架的能力。深度学习框架是实现算法的基础架构和工具,可类比为开发过程中必须使用的操作系统(如游戏制作过程中的虚幻引擎)。从技术定位看,AI 框架对下调用底层硬件计算资源,能够屏蔽底层差异并提供良好的执行性能,对上支撑 AI 应用算法模型搭建,提供算法工程化实现的 标 准 环 境,是 AI 体 系 的 关 键 核 心。目 前 海 外 AI 框 架 领 域 已 经 形 成TensorFlow(Google)、PyTorch(Meta)双 寡 头 格 局,国 内 主 流 AI 框 架 主 要有PaddlePaddle(百度)、MindSpore(华为)、MegEngine(旷视)


    注意事项

    本文(AGI(通用人工智能)专题之二:“文心一言”发布国内厂商距离复现ChatGPT有多远?)为本站会员主动上传,启牛文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读启牛文库网的“版权提示”【网址:https://www.wojuba.com/h-37.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    启牛文库网为“电子文档交易平台”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。

    本站是网络服务平台方,若您的权利被侵害,请立刻联系我们并提供证据,侵权客服QQ:709425133 欢迎举报。

    ©2012-2025 by www.wojuba.com. All Rights Reserved.

    经营许可证编号:京ICP备14006015号