实测腾讯首个大模型App:秒读60万字财报精准读图识猫信息搜索有待提升

  腾讯元宝定位于全能AI助手,针对效率场景的信息获取、处理和生产三大核心需求进行了优化;面向日常生活场景,元宝提供了图像生成、生活帮手、UGC创作等特色AI应用,并新增了创建个人智能体等功能。

  据介绍,此次产品能力升级,背后来源于腾讯混元底层模型的持续迭代。腾讯混元大模型于去年9月发布,到目前整体性能提升超50%,包括参数规模从千亿升级至万亿、预训练语料从万亿升级至7万亿tokens、架构升级为混合专家MoE等。

  刘煜宏称,腾讯的优势主要在于三个方面:一是产品工程能力较强,在工程方面能够压缩成本;二是腾讯的产品体系是最全的,对各个应用领域的适配度更强;三是混元大模型本身的性能优势,腾讯从去年就开始在文生图方面采用DiT架构,也很早就开始采用MoE架构,技术演进很快。

  谈到与其他AI产品是否存在同质化现象,刘煜宏称,腾讯做大模型最初是为了满足公司内部业务需求,在这个过程中发现很多用户、企业也有这方面的需求,所以开放给大家使用。在产品化上,腾讯最优先考虑的是用户需求,用户是否需要这个产品、需要哪些功能,而不是去对标竞品。

  作为腾讯推出的首款混元大模型原生应用,腾讯元宝表现如何?智东西第一时间上手体验了元宝App,发现其虽然与市面上已有的大模型App有一些重合的功能,但在生成速度、内容优质程度上,表现出一定的优势。

  刘煜宏首先谈道,现阶段AI应用虽然层出不穷,但整体AI产品渗透率仍然很低。头部AI产品日活跃用户规模约为百万,按互联网用户规模12.32亿来看,在整个互联网渗透率不到1%。

  在腾讯看来,渗透率低主要是因为大模型仍在发展期,产品解决方案不够成熟,应用场景有限;其次,用户层面的认知仍在建立,据腾讯调查,目前对AI的需求主要集中在搜索、效率场景,有约45%的人将其当作搜索引擎来用。

  腾讯于去年9月发布了混元大模型并推出小程序版,当时的模型为千亿参数规模,预训练语料万亿tokens,4k上下文窗口。

  经过不到一年的迭代,目前混元大模型效果整体提升50%,达到万亿参数,预训练预料7万亿tokens,上下文窗口扩展到256k。

  目前,腾讯内部已有600+业务接入混元大模型。刘煜宏透露,混元每天调用量超2亿,公司内部有23%左右的代码都由AI生成。

  基于用户洞察,腾讯认为大模型原生AI产品需要满足两大需求。一是贴近用户场景,包括职场办公、学习充电、休闲娱乐等;二是满足高频需求,如搜索问答、效率提升、创意生成。

  针对这些需求,腾讯推出全能AI助手腾讯元宝App,面向效率场景的三大核心需求——信息获取、处理和生产,进行定向优化。

  据介绍,在AI搜索方面,腾讯元宝接入了微信搜一搜、搜狗搜索等搜索引擎,并通过AI搜索增强,提升时新类和知识类问题效果;同时,内容覆盖微信公众号等腾讯生态内容及互联网权威信源,答案准确性更高;此外,元宝还会提供所引用的参考资料,并给出相关推荐,方便快速溯源及延伸阅读。

  在AI总结方面,元宝可上传最多10个PDF、word、txt等多种格式文档,并能够一次性解析多个微信公众号链接、网址,支持256k原生窗口上下文,相当于一本《三国演义》或是英文原版《哈利波特》全集。

  此外在日常生活场景,腾讯元宝也能有问必答,提供图像生成、内容创作、学习助手、生活帮手、UGC创作等多种AI应用。刘煜宏称,在腾讯看来,大模型AI产品的用户价值终点是“服务于每个普通人的生活”。

  元宝网页端、小程序端也同步上线,同时将联合腾讯系业务、合作伙伴、腾讯元器创作者等,共创AI应用生态。

  打开腾讯元宝App,主页面是一个对话框,顶部有两个小模块,分别显示日期、天气、实时资讯以及随机问题建议;下方提供了在AI搜索、文档总结、网页总结、AI作图等能力方面的随机提问建议。

  点击顶部的“元宝”按键,会出现开始新对话、删除聊天记录的选项,此外还可以切换语音音色,目前有20多种音色可供选择,还提供了创建自己声音的功能。

  元宝很快给出了回答,从起源、背景信息、社会反响、社会意义等方面介绍了这个事情的发生经过和后续影响,并推荐了更多内容和可以进一步追问的选择。

  当我追问:阿姨的咖啡店在哪里可以找到?元宝准确地答出店铺地址,并补充了营业时间和相关注意事项。

  除了了解当下的热点信息之外,我也想了解未来的趋势或可能发生的事。我问道:苹果下个月的WWDC可能会发什么?

  不过这个回答中存在部分不够准确的信息,如将Vision Pro划分为“新产品”等。点开这句回答的参考资料链接,可以看到是一篇去年6月Vision Pro发布的新闻稿。

  在平日的搜索中,对图片的识别和提问也是很常见的需求。我上传了一张小猫实拍图,问元宝这是什么品种的猫。

  元宝首先答出这是英国短毛猫,但我想进一步了解是英短里的什么品种,追问后,元宝准确地将范围缩小到银渐层或蓝金渐层。

  在AI总结能力上,元宝支持256k上下文窗口。我首先上传了一篇Llama的论文,让元宝替我解读。

  英文财报的信息提取也是日常工作中的高频场景。我上传了一个187页的英伟达年度财报文件,元宝进行文件解析后,显示有64.2万字。

  在财务表现部分,元宝提到了英伟达在2024财年取得的营收、净利润数据。平时在使用AI提炼这类内容时,有时会遇到数据不准确的问题,我还是打开财报文件自己核实了一下。值得庆幸的是,元宝提供的数据十分准确。

  随后我又上传了《三体》全集电子书,元宝解析后显示字数达到92.9万。我问道:云天明讲了什么样的童话?

  发布会上提到,元宝可以一次性解析多个微信公众号链接。于是我输入了两个智东西公众号的文章链接,让元宝总结主要内容。

  元宝对小红书平台的风格拿捏得不错,用了丰富的表情符号,文章结构也比较合理,最后还补充了相关Tag。

  元宝给出的策划方案十分详细,包括每个环节的时间内容,在内容上策划了运动会、手工制作、表演等形式,并贴心地提供了活动准备、注意事项相关的建议。

  体验下来,我的感受是元宝的生成速度比较快,搜索、总结内容方面虽然出现了一些小失误,但瑕不掩瑜,整体准确度还是比较高的。此外在标注出的参考资料上,能看到有不少出自微信公众号文章,这样的信息来源为元宝提供了内容上的差异化竞争力。

  除了对话式AI,元宝还提供了多种智能体功能,主要分为工作、生活两大类,包括翻译、PPT、文案撰写、营销专家等效率类工具,以及创意贴纸、创意绘画、AI头像等娱乐向工具。

  根据系统推荐,我首先体验了“创意贴贴贴”功能,它能根据文字输入或图像输入创建不同风格的贴纸。

  我上传了一张猫咪全身照,元宝很快生成了4张对应的贴纸图像。虽然看花色似乎有些差异,不过整体神态、动作、颜色都比较符合。

  在创意绘画智能体中,元宝可以根据简单的文字描述生成对应图像,实际体验下来生成时长大概在5秒。点开生成的图像可以看到,元宝自动扩展了提示词,增加了更多细节、景别描述等。

  我还体验了种草文案写手智能体,根据提示,只需输入商品名称就可以生成宣传文案。我输入了樟脑丸,看看这个东西要怎么去安利。

  元宝首先给它定位为“超级实用的小物件”,随后从产品特点、使用感受、实际效果、使用方法来进行种草,最后给出了使用注意事项。

  整体来看,元宝在智能体能力上表现也不错,作为工作、生活帮手能提供有价值的信息。虽然目前官方提供的智能体选择还不是特别丰富,不过与腾讯元器打通后,应该会呈现出更多有趣的功能选择。

  随着腾讯元宝的正式上线,大模型App赛道再次迎来一位强有力的选手。现阶段,元宝虽然在功能创新、实时信息搜索准确度上仍有提升空间,不过在生成速度、内容质量上也有一定优势。

  作为业务广泛的互联网大厂,腾讯在产品工程能力、技术创新上都有很大的积累。我们期待元宝在未来的迭代中呈现出更丰富的功能和更高的水准,也期待它的加入能为大模型App赛道带来良性竞争。

  (本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

主题测试文章,只做测试使用。发布者:小编,转转请注明出处:https://www.yingzhewang.com/yunying/3736.html

联系我们

在线咨询:点击这里给我发消息

邮件:admin@yingzhewang.com