人工智能-ChatGPT用户破百万关注超大规模自然语言处理预训练模型-221211

文档编号：2601205

上传时间：2023-05-27

格式：PDF

页数：12

大小：1.42MB

《人工智能-ChatGPT用户破百万关注超大规模自然语言处理预训练模型-221211》由会员分享，可在线阅读，更多相关《人工智能-ChatGPT用户破百万关注超大规模自然语言处理预训练模型-221211（12页珍藏版）》请在启牛文库网上搜索。

1、本报告由中信建投证券股份有限公司在中华人民共和国（仅为本报告目的，不包括香港、澳门、台湾）提供。在遵守适用的法律法规情况下，本报告亦可能由中信建投（国际）证券有限公司在香港提供。同时请参阅最后一页的重要声明。证券研究报告行业动态ChatGPT 用户破百万，关注超大规模自然语言处理预训练模型产业要闻【5 天用户破百万，ChatGPT 背后有何玄机】行业变化 2022 年 11 月 30 日，OpenAI 发布了 ChatGPT 人机对话交互模型，相比过去的人机对话模型，ChatGPT 展现出更贴近人类的思维逻辑，可以回复用户的连续问题，具有一定的道德准则，减少了错误问答的出现概率，具备代码的

2、编写和 debug 功能。ChatGPT 在人机对话上到达了前所未有的高度，模型开放测试一周用户便突破了百万级别。ChatGPT 作为 GPT3.5 的微调版本，采用了基于人类反馈的强化学习（RLHF）和近端优化策略（PPO），通过奖励模型的设定，极大减少了无效的、编造的、有害的答案出现概率，更多输出了人们期望的答案。当前 ChatGPT 已经在诸多问答环节里表现出极高的拟人化，足以以假乱真。目前 ChatGPT 处于免费的开源公测阶段，仍在优化迭代过程中。前代版本 GPT-3 已经商业化落地，基于 GPT-3 产生的 APP 达 300 多个，覆盖传媒、营销等领域，OpenAI 以 API

3、的形式向开发者提供有偿的 GPT-3模型使用权限，按照 token（1000 tokens=750 words）使用量收费，1000 tokens 收费在 0.00040.2 美元之间。我们预计，超大规模的自然语言预处理模型将率先在传媒营销、搜索引擎增强、代码编程等领域实现商业落地。当前自然语言处理的快速发展已让我们更加临近图灵测试的奇点，未来人工智能将深刻地改变我们的生产生活方式。我们应当重点关注自然语言处理的技术进展、大规模商业的落地途径以及我国超大规模预训练模型的发展进展。持续关注：GPU：英伟达、超威半导体、海光信息等；FPGA：安路科技-U 等；SoC：高通、全志科技等；自然语言处理

4、：科大讯飞等；计算机视觉：云从科技-UW、商汤-W、格灵深瞳-U 等；自动驾驶：德赛西威、中科创达、均胜电子、光庭信息；智慧交通：千方科技、万集科技；AI+工业：中控技术、华大九天、广立微、概伦电子等。风险提示：北美经济衰退预期逐步增强，宏观环境存在较大的不确定性，国际环境变化影响供应链及海外拓展；芯片紧缺可能影响相关公司的正常生产和交付，公司出货不及预期。维持强于大市于芳博 010-86451607 SAC 执证编号:S1440522030001 发布日期：2022 年 12 月 11 日市场表现相关研究报告-35%-25%-15%-5%5%15%2021/12/102022/1/102

5、022/2/102022/3/102022/4/102022/5/102022/6/102022/7/102022/8/102022/9/102022/10/102022/11/10计算机上证指数人工智能获取更多最新资料请加微信：chensasa666 1 人工智能行业动态报告请参阅最后一页的重要声明一、行业变化 2022 年 11 月 30 日，OpenAI 发布了 ChatGPT 人机对话交互模型，相比过去的人机对话模型，ChatGPT 展现出更贴近人类的思维逻辑，可以回复用户的连续问题，具有一定的道德准则，减少了错误问答的出现概率，具备代码的编写和 debug 功能。ChatGPT

6、在人机对话上到达了前所未有的高度，模型开放测试一周用户便突破了百万级别。OpenAI 是 2015 年成立的一家人工智能公司，提出过很多里程碑式的人工智能模型，包括性能强大的自然语言预处理模型 GPT-3，用于图像生成的模型 DALL-E 2，击败 Dota 2 电竞职业选手的 OpenAI Five。此次发布的 ChatGPT 是 GPT3.5 的微调版本，在过去的 GPT 模型基础之上增加了 3H 目标，其中包括：Helpful：帮助用户实现任务目标，Honest：不会编造信息误导用户，Harmless：不会对用户造成心理、生理、社交方面的损害。过去的 GPT 模型采用了掩码策略去训练模型

7、，会根据特定的上文内容生成不同概率的后续文本，由于采用纯无监督学习方式，可能呈现诸多无效的、编造的、有害的答案。ChatGPT 通过基于人类反馈的强化学习方式（RLHF）和近端优化策略(PPO)很好的减少了相应情况的发生。图表1：基于人类反馈的强化学习在 ChatGPT 中的应用资料来源：OpenAI，中信建投 ChatGPT 主要通过三个步骤来实现基于人类反馈的强化学习：1.人工标注员提供一个人工编写的演示数据集，在 ChatGPT 的兄弟版本 InstructGPT 中，采用了 40 位人工标注员挑选的 13000 个问答组成数据集，通过数据集去微调 GPT-3.5 语言模型。2.人工标注

8、员对模型输出的候选答案进行优劣排序同时给予不同的奖励值，将所有的问答训练得到一个奖励模型，对于特定的答案会有对应的奖励值输出。3.通过近端优化策略去持续更新策略参数，使其符合最大化的奖励模型。获取更多最新资料请加微信：chensasa666 2 人工智能行业动态报告请参阅最后一页的重要声明训练过程中，3H 目标也以一定的奖励比重影响到最后的结果呈现，经过基于人类反馈的强化学习，ChatGPT很好的呈现了人们期望的答案，但是也应当注意，人工标注员因为具备不同的文化、背景、信仰，标签可能存在一定的偏见。我们认为，当前自然语言处理的快速发展已让我们更加临近图灵测试的奇点，我们应当重点关注自然语言

9、处理的技术进展、大规模商业的落地途径以及我国超大规模预训练模型的发展进展。当前 ChatGPT 已经在诸多问答环节里表现出极高的拟人化，足以以假乱真。预期 GPT-4 将于明年发布，根据 OpenAI 首席执行官萨姆阿尔特曼表示，GPT-4 将是纯文本模型，规模略大于 GPT-3，更专注于数据、算法、参数的优化。我们更加临近人工智能通过图灵测试这一历史时刻，未来人工智能将深刻地改变我们的生产生活方式。目前 ChatGPT 处于免费的开源公测阶段，仍在优化迭代过程中。前代版本 GPT-3 已经商业化落地，基于 GPT-3 产生的 APP 达 300 多个，覆盖传媒、营销等领域，OpenAI 以

10、API 的形式向开发者提供有偿的 GPT-3模型使用权限，按照 token（1000 tokens=750 words）使用量收费，1000 tokens 收费在 0.00040.2 美元之间。我们预计，超大规模的自然语言预处理模型将率先在传媒营销、搜索引擎增强、代码编程等领域实现商业落地。图表2：超大规模的自然语言预处理模型发展历史资料来源：State of AI Report 2022，中信建投预训练模型需要大量数据支持，中文语料库仍有所匮乏，建议关注部分中文自然语言处理的预训练模型。预训练模型通过大规模文本库进行高算力的预先训练，得到通用的语言模型和表现形式，再经过特定应用环境对预训练

11、模型进行微调，从而在各种下游应用领域得到目标任务的快速收敛和准确率提升。大规模的文本库来源与最后的训练结果密切相关，包括 chatGPT 在内的预训练模型因为中文语料库的匮乏，中文的语言处理有时表现不尽如人意。建议重点关注部分中文自然语言处理的预训练模型，包括华为的盘古大模型、浪潮的源 1.0、百度的文心大模型、清华大学的双语预训练模型 GLM 等。GPT-3(175B)Pan-Gu(200B)HyperCLO VA(204B)Jurassic-1 Jum bo(204B)FLAN (137B)June 2020M ay 2021M egatron Turing-N LG(137B)Yuan

12、1.0(246B)Sep 2021Gopher(280B)Ernie 3.0 Titan(260B)LaM D A(280B)Jan 2022GPT-j(6B)GPT-N eoX(20B)Aug 2021PaLM (540B)O PT(175B)BLO O M (176B)GLM (130B)M ay 2022Aug 2022Chinchilla(70B)chatGPTNov 2022获取更多最新资料请加微信：chensasa666 3 人工智能行业动态报告请参阅最后一页的重要声明二、持续关注标的 GPU：英伟达、超威半导体、海光信息等；FPGA：安路科技-U 等；SoC：高通、全志科技等；

13、自然语言处理：科大讯飞等；计算机视觉：云从科技-UW、商汤-W、格灵深瞳-U 等；自动驾驶：德赛西威、中科创达、均胜电子、光庭信息；智慧交通：千方科技、万集科技；AI+工业：中控技术、华大九天、广立微、概伦电子等。三、行情回顾上期，人工智能指数（中证）指数上涨 0.09%，本月份以来累计上涨 2.10%，上证指数上涨 1.61%，沪深 300 指数上涨 3.29%。图表3：中证人工智能指数、上证指数、沪深 300 指数涨跌幅比较资料来源：Wind，中信建投中证人工智能指数板块个股方面，涨幅前五个股分别为：科沃斯（+13.61%）、海康威视（+8.11%）、晶晨股份（+7.03%）、中兴通讯

14、（+5.83%）、大华股份（+3.81%）；涨幅后五个股分别为：易华录（-9.38%）、奥普特（-8.69%）、安恒信息（-8.66%）、启明星辰（-7.71%）、太极股份（-7.08%）。-10%-5%0%5%10%人工智能上证指数沪深300获取更多最新资料请加微信：chensasa666 4 人工智能行业动态报告请参阅最后一页的重要声明图表4：人工智能（中证）个股周涨幅前十名（%）图表5：人工智能（中证）个股周涨幅后十名（%）资料来源：Wind，中信建投资料来源：Wind，中信建投图表6：重点公司股票涨跌详情重点公司股票涨跌详情归母净利润 PE 区间行情股票代码公司名称行业

15、单位 2021 2022E 2023E 2021 2022E 2023E 本周月初至今年初至今 NVDA.O 英伟达 GPU 亿美元 97.5 45.6 81.0 42.9 91.7 51.6 0.7%0.5%-42.1%AMD.O 超威半导体 GPU 亿美元 31.6 18.2 38.8 35.0 60.9 28.5 -8.5%-11.6%-52.3%688041 海光信息 GPU 亿元 3.3 10.0 16.6 325.1 105.9 64.2 5.8%10.4%-23.9%688107 安路科技-U FPGA 亿元(0.3)0.4 0.8 (839.1)661.8 314.3 -

16、2.4%3.1%-9.8%688256 寒武纪-U ASIC 亿元(8.2)(10.1)(6.3)(31.9)(26.2)(41.6)-0.4%3.6%-30.9%QCOM.O 高通 SoC 亿美元 90.4 98.2 117.1 14.8 13.6 11.4 -5.3%-5.9%-33.5%300458 全志科技 SoC 亿元 4.9 3.8 4.3 26.5 34.5 30.3 -2.0%-1.6%-36.8%603893 瑞芯微 SoC 亿元 6.0 6.0 9.0 52.7 53.0 35.4 -4.1%-1.6%-44.0%688099 晶晨股份 SoC 亿元 8.1 11.1 14.8 40.6 29.6 22.3 7.0%5.5%-38.8%002036 联创电子汽车摄像头亿元 1.1 3.1 5.3 124.8 45.5 26.4 -0.6%1.8%-46.1%2382.HK 舜宇光学科技汽车摄像头亿元 49.9 30.9 42.7 23.6 38.1 27.5 13.6%17.8%-56.1%603501 韦尔股份 CIS 亿元 44.8 38.8 52.4

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

2 积分

下载	开通VIP享超值特权

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 人工智能 ChatGPT 用户百万关注超大规模自然语言处理训练模型 221211

启牛文库网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：人工智能-ChatGPT用户破百万关注超大规模自然语言处理预训练模型-221211
链接地址：https://www.wojuba.com/doc/2601205.html