AutoGLM是智谱清言开发的一款智能AI产品,它的智能AI产品不能可以用来对话,或者用来生成各种文档,同时还能生成图片以及视频,拥有更加广泛的使用范围。
在今天,智谱「Agent 交互新体验」OpenDay 上发布的 升级版 AutoGLM,就是一个很具象很贴切的例子。
AutoGLM 是智谱于上个月发布的“住在手机里的 AI 管家”,基于自研的「基础智能体解耦合中间界面」和「自进化在线课程强化学习框架」的第一个产品化的 AI Agent。
用户可以通过文字或语音指令,让 AI Agent 模拟人类操作手机,实现大模型从表达到执行的范式转变。
而一个月后的今天,智谱又对 AutoGLM 进行了升级,带来了更好的产品体验,向更智能的方向进步!
AutoGLM 的这一次升级具体包括:
1. 复杂步骤与循环操作:可以自主执行超过 50 步无打断操作,还可以实现操作流程复现。
2. 跨 App 操作:具有更强大的泛化能力和思维链,支持复杂任务跨 App 操作。
3. 记忆与快捷指令:在用户授权下,AutoGLM 能记住过往选择,用户触发特定指令后,AI 会自动采取对应行动。
4. AI 主动决策:对于用户的模糊指令,可以主动帮用户做决策。
一想到能够解放双手,用嘴提需求 AI 就能控制我的手机完成任务,就非常激动。
于是我们第一时间申请了内测,并对 AutoGLM 进行了测试。
有时候在看电视的时候,发现了某个网红或者梗不太了解,于是就会暂停拿手机去搜搜关注一下,现在直接命令 AutoGLM 就行。比如让它帮我打开某音关注下听泉赏宝。
再比如让它打开某团给我点个常吃的烧烤(打工人们的时间都太宝贵了,能省一点是一点吧www)。
再比如打开淘宝买个键盘(这还挺好的,平台经常为了留存和变现,搞些有的没的活动和广告,一不小心就掉进去了,现在说两句话 AI 就直接帮你直达结果了)。
此外,打开官方文档可以发现 AutoGLM 能做的不只有这些,还包括超多能力!
本质上,AutoGLM 是基于 AI Agent 强大的任务规划能力以及屏幕界面信息理解能力(使得任务的操作执行不再受限于简单任务场景或 API 调用,也不再需要用户手动搭建复杂繁琐的 Workflow)仅通过自然语言指令即可实现复杂任务的快速执行。
在真实使用过程中,用户还会出现很多意想不到的情况,此时 Agent 可以运用其一定的判断与自我纠错能力,并且可以在任务执行的过程中持续与用户交互反馈,同时还可以调用多种工具,根据用户的要求精准完成操作。
除了在安卓有 AutoGLM 的 App,这次智谱还带来了AutoGLM-Web。
AI Agent 可以理解用户的指令,自动为用户在网页上做站内检索、多链接总结。甚至进一步实现生成 arXiv 日报,搭建 GitHub 仓库,在微博超话签到等个性化功能,极大提升用户的工作效率。
值得一提的是,除了强大的 AutoGLM,网页版清言插件还搭载了量子速度、量子速写等 AI 实用工具。
使用量子速读功能,AI 可以根据用户指令搜索并打开网页,阅读总结网页内容;使用量子速写功能,可以在网站平台用 AI 帮助撰写评论。
比如让它在知乎上自动帮忙回答一个问题。再比如让它帮忙直接发个微博~
One More Thing,智谱还带来了全新的GLM-PC!
这是可以操作 PC 的桌面应用,用户通过简单的一句话就能快速执行复杂任务。
基于 CogAgent 模型的视觉理解能力和任务规划能力,GLM-PC 可以理解屏幕界面的信息,在使用过程中,能够根据页面信息进行计划更改和自我纠错,根据用户的指令完成任务。
比如我想看战狼了,不用点来点去打字啥的,直接跟 Agent 说就行。
在 AI Agent 的范式中,Agent 理解界面、感知环境、规划任务、使用工具,最终完成任务。
而在智谱看来,对照业界对人工智能的分级,AI Agent 在 L3 使用工具能力有了极大提升,同时也开启了面向 L4 自我学习能力升级的旅程。
无论是手机端还是 Web 端、PC 端,都是智谱构建GLM-OS的不同尝试,这是以大模型为中心的通用计算系统。
AutoGLM 和 CogAgent 有着同样一个目标,那就是能够实现模仿人类的Plan-Do-Check-Act 循环,像人一样形成自我反馈和自我提升。
因此,我们可以将智谱发布的这些 AI Agent 产品视为 GLM-OS pre,也就是目前可以体验到的惊艳创新,实际上也只是大模型通用计算系统的初级阶段。
我们相信,随着大模型技术的持续推进,AI Agent 对人机交互变革对重塑才刚刚开始!!!
简单说,AutoGLM就是利用AI大模型强大的理解和执行能力,实现「全自动上网」
比如我们打开百度,然后点击右下角的清言图标,清言就会在右侧显示侧边栏,我们点击高级模式,选中AutoGLM然后输入一个很口水话的指令,比如“去芒果TV上点《小巷人家》并播放第一集”,然后清言就会理解并自动帮你搜索、播放,非常强悍
清言不仅支持百度,同时还支持谷歌和必应搜索,你想用哪个用哪个又比如打开知乎,输入指令“在知乎热榜第一个话题下面回答并发布”,它还真就找到了热榜点进去,点开了第一个话题,然后输入了根据这个话题写的回答,并且还点了发布,贴心的是,涉及发布、删除这种敏感性操作它都会弹窗提示你之后再执行
又或者打开豆瓣网站,让它“找几部最新的动作电影”,它马上就会打开豆瓣的电影页面,切换类型为动作,排序改成近期热度,并且提取前几个电影信息合并后展示推荐给你
可以看到AutoGLM主打就是一个解放双手,全自动除了上面说的网站,AutoGLM功能还支持微博、百度贴吧、百度学术、谷歌学术、GitHub、网易新闻等,如果你还想支持更多网站,还可以和官方反馈
站内高级检索除了AutoGLM功能,清言插件另一项非常强大的功能是站内高级检索,它目前支持小红书、知网、维普、百度学术、谷歌学术、知乎、百度搜索、谷歌搜索、必应搜索这些站点
啥意思呢,比如你可以在小红书网站打开清言侧边栏菜单,输入“搜索华为Mate70系列的抢购攻略”然后它就会在网站内搜索内容,并且一一打开查看,最后给你总结出关键信息,这样就不用你手动搜索一一查看自己找信息了,不用看那么多文字,多方便!
多链接总结而多链接总结功能呢和前面个站内高级检索类似,只不过你可以手动选择任意链接来总结出关键信息
不过多链接总结支持任意网站,功能更加全面!写作助手再来看写作助手功能,在浏览器网页中,不管是写文章、写邮件、写周报,还是写影评、写回复等需要编辑的场景,你都可以点击清言插件的悬浮图标,让它一键生成和插入想要的内容,非常方便
而且你会发现它在不同网站写出来的内容风格还会不一样,比如知乎的一句“谢邀”开头,那个味就不一样了!总结有一说一,小棉袄觉得清言这扩展插件真的很实用,能省很多事,强烈建议人人必备!
1、打开智谱清言APP,在主页面找到AutoGLM
同时官方贴心给出大家常见的问题,包括怎么申请、优势等。
2、点一下“我有安卓手机,如何申请内测”。
而且它与传统内测的方式不一样,只需用对话式就可以自动完成。
而且申请通过速度也挺快,笔者刚申请完,第二天就收到短信了。
注意:它事一个单独的APP,内测后下载链接,也有详细使用说明。
接下来我们看下AutoGLM的适用范围
通过使用,我们发现,其不仅仅是一个智能助手,随着你与其更多互动,将会有更多隐藏功能和惊喜。
MITO影视是一款全新推出的优质应用,去除了所有广告,为用户提供清爽无干扰的使用体验。该应用拥有丰富的资源库,涵盖各类内容需求,内置多条高速资源源,确保用户流畅观看。
在汽车成为人们重要出行工具的今天,车主们对车辆状况的了解和维护需求日益增长。Torque车况软件就像是一位专业又贴心的汽车管家,它利用先进的汽车诊断技术随时随地监测车辆状况。
CuteNotes宛如一个随身携带的智能秘书,将便捷的记录功能与个性化的设计巧妙融合,打破传统笔记软件的单调模式,为用户打造一个自由记录、轻松管理的数字空间。
无论你身处世界的哪个角落,都能通过sky tonight软件探索当地的星空。此外,用户还可以手动切换不同的地理位置,查看其他地区的星空景象,满足用户对不同地区星空的探索需求。