当前位置: 首页 > 动态 > 正文

暴走1万步,36氪带你看AI春晚|直击WAIC 2023

2023-07-06 19:23:1936氪

作者 |杨逍 林炜鑫


(资料图片仅供参考)

制图 |虞景霖

编辑 |苏建勋

大模型的风吹了半年,2023年的世界人工智能大会(WAIC)成了不可缺席的盛典。

7月6日,WAIC在上海世博展馆正式开幕。本次WAIC参展企业超400家,首发产品达30余款,大会聚集了国内外领军学者、知名企业家、国际组织代表等1400余位嘉宾,国内外院士80余位。

可以说国际上有头有脸的人工智能专家、创业者都集齐了,特斯拉CEO埃隆·马斯克(Elon Musk),华为轮值董事长胡厚崑,微软全球资深副总裁、微软大中华区董事长兼CEO侯阳,地平线创始人、CEO余凯,图灵奖得主杨立昆(Yann LeCun),微软原执行副总裁、美国国家工程院外籍院士沈向洋与IEEE CEO拉曼......

和热闹的学术、产业盛典相比,展馆中的展品也并不逊色。大模型、机器人、自动驾驶等企业都争相大秀肌肉。这里大概是,离未来最近的地方。

从大模型火热以来,AI绘画、AI写文、AI作诗等早已不是新鲜事。

展会上,腾讯带来了AI游长城的体验,站在展厅中间,就如同真实地站在长城墙上,能一览城墙外的高树和墙上的一砖一瓦;

商汤则带来了针对篮球运动的智慧篮球场,不用摄影师,就可以记录下投中三分的精彩瞬间;

还有人体支架一般的康复机器人、做切割手术的微创机器人、能翻跟头的巡检机器人,都着实吸引眼球。

顶着上海30度的湿热,36氪深度参观了本届WAIC,为大家带来了第一手的AI报道,以及那些即将在AI助力下,进入大众生活的智能体验。

一、玩转AI应用

AI除了能写诗、画画,还可以成为你的球场专属拍摄员,24小时口语教练,让你云游长城,漫步中国。

商汤的智慧篮球场和秒画

实时记录投中三分球的高光时刻不再是梦想。

每一个打球的人或许都希望自己是聚光灯下的焦点。现在,商汤科技的SenseShot智慧篮球场能帮你实现心愿。

在AI能力的加持下,这块球场实现了无人化赛事直播。当你站上球场,直播摄像头自动跟踪篮球和球员进行运镜,实现“推/拉/摇/移”的直播效果。直播画面还能实时显示比赛得分。

打完球,你可以在商汤科技的SenseShot(智胜时刻)小程序看到自己和球队的精彩镜头视频集锦、AI运动分析等。

团队利用了2D关键点提取和3D视频动作捕捉技术等进行了球场3D建模,市民在录入人脸信息后,系统会自动捕捉人脸人体的29个关键点和篮球,进行单人/多人的逻辑计算和分析。有了每个人在空间中的三维坐标,就能够实现镜头的自动跟随、个人视频集锦以及分析人在不同运动状态下的动作特点。

商汤SenseShot~智慧篮球场

据商汤工作人员介绍,实现这样一种运动类型的数据训练和轨迹捕捉,大概只需要一周的时间。

除了智能篮球场,商汤也展现了其画面生成功能的SenseMirage秒画功能。

商汤SenseMirage秒画

不懂代码没关系,只要输入简单的prompt(文字描述),商汤秒画平台就能生成你想要的图像,而且支持二次元、三次元等多种风格。这背后是基于商汤“日日新”大模型的支持。比如,把20张港风照片拖到秒画平台,大概只需要几分钟,就能获得一个能够生成港风照片的大模型。

腾讯AI游长城

在腾讯展台上,腾讯游戏将整座长城搬到了手机上,用户只需要踏上长城开启键,就可以通过裸眼3D全息投影展陈的方式,云游长城。

而这背后想展示的,是腾讯的云游长城。为了提升使用体验,开发团队运用自研AI技术,加强画质。我们不仅能看到长城上的砖块纹路,还能看到一只蝴蝶从长城石阶上的树枝飞过。

腾讯~AI游长城

借助数据自动生成和植被模型处理等AI能力,它真实再现了长城的峡谷、山峰、悬崖、岸边等不同地形,有不同高低落差、不同种类的植被错落,实现了毫米级别的长城主体,以及清晨、中午、傍晚、深夜不同时间的光影交互,和动态的植被、鸟虫云雾等特效。

网易有道口语教练

找英语口语教练不再是难题。

虚拟人口语教练是网易有道首个教育领域自研大模型“子曰”的应用成果,希望成为普通人英语口语练习神器。

口语教练不仅有类真人形象,发音地道,还能进行开放式对话,适配不同英语水平的用户。

网易有道~口语教练

在对话过程中,口语教练像老师一样,有步骤地引导、启发式学习陪伴,同时还能进行实时反馈。在生成对话报告中,AI老师会从发音、语法等维度给予建议和润色,尽最大可能帮助英语口语学习者。

这款产品,目前仍处于测验阶段,即将上线,在网易有道等产品中就可以免费使用。

出门问问 奇妙元 3D数字人

短视频达人都在用的数字人创作平台,要属奇妙元了。

该平台由出门问问的创新团队打造,拥有数十位高逼真写实数字人和3D数字人,还有百余种精品发音人可供选择。平台提供一站式服务,仅需5分钟、简单4步,就能批量生成你想要的视频内容。

在展会上,身穿出门问问轨迹定位设备的小姐姐在前方舞蹈,后方视频正实时生成3D动漫人物。

出门问问~奇妙元3D数字人

会玩的朋友,也可以在奇妙元制作自己的数字分身,只需前期采集5分钟有效的人物视频,就能构建一个媲美真人的AI数字分身。

蜜度文稿通:一位诗人

蜜度展区站着一位“AI诗人”,只要把你想要的主题风格告诉它,比如“故乡”“青春”“塞外大漠”等提示词,它就能现场作诗,交给你一篇符合主题的现代诗。

蜜度文稿通

"AI诗人”即蜜度推出的AI辅助创作工具——文稿通,除了写诗,文稿通还覆盖了媒体稿件、政务公文、企业办公等不同应用场景。在功能上,文稿通拥有AI写作、续写、配图和校对4大模块,用户可以一站式完成文稿写作。

二、机器人已来

机器人无疑是本场展会的亮点之一。

医疗机器人、巡检机器人等产品,在人工智能技术帮助下,已掌握了灵活的避障能力、行走能力、工作能力,可以作为生产力工具进入工业、医疗现场,帮助降低人的工作压力。

人形机器人,则由于其硬件难度高、软件智能程度、情绪感知能力要求高,被称作机器人界难以攀越的珠峰。很长一段时间,只有技术一流、商业化场景不明的波士顿动力在撑起这个赛道。在大模型技术爆发后,其流畅的对话能力,让学界和产业界又燃起了对人形机器人的期望。

特斯拉Optimus

本场的最大亮点,本应该是特斯拉的Optimus,就在开幕式上,马斯克还通过连麦的方式为其Optimus打广告,表示特斯拉希望通过Optimus来取代人类劳动中重复、无聊且危险的部分。未来,这款产品会将先应用于工厂。

然而,在展台上,特斯拉没有带来真“人”Optimus,只展示了其模型。

据特斯拉展台工作人员介绍:“Optimus搭载了D1芯片,能实现的只有动作交互,对话和情感交互还在研发,未来还会想开拓C端的场景,比如陪护,遛狗。目前的价格和model Y差不多,暂时不量产。”

特斯拉Optimus

傅利叶人形机器人和外骨骼机器人

傅利叶在开幕式上推出了他们的人形机器人GR-1。有1.65米高,体重110斤,标准健康体重。

为了实现这样的能力,GR-1全身自由度有40个关节,最大关节模组峰值扭矩可达300NM,步行速度可达到5KM/h,能负重50公斤。

傅立叶人形机器人

它有着不错的运动能力,整个身体高度仿生,运动控制也呈现拟人化姿态,可以进行快速行走、敏捷避障、稳健上下坡、抗冲击干扰等动作。未来,GR-1可以用在抢险救灾、养老陪护、家政服务等应用场景。

傅利叶也带了外骨骼机器人出场,主打康复功效。

傅利叶外骨骼机器人

这款产品主要用来帮助病人复健,在身体行动不便时,身体肌肉不会出现萎缩等情况,帮助肢体障碍的人士重新恢复运动功能。

达闼人形机器人

让机器人跳舞有多难?达闼推出的服务机器人Cloud Ginger 1.0(小姜)表示,so easy。当你告诉小姜,“跳个舞吧”,小姜就会跟随音乐开始起舞。你还别说,小姜的身板毫不僵硬,手臂灵活,卡点精准,最关键的是,小姜给人舒展、松弛之感,打破了我们对机器人的刻板印象。

工作人员介绍,小姜身高158cm,搭载34个智能柔性关节SCA,还内置多个2D/3D摄像头、激光雷达、超声传感器等。小姜的大脑搭载了自研的HARIX OS操作系统,赋予小姜AI能力。

达闼机器人

实际上,小姜不仅会跳舞,还能冲咖啡。得益于高精度的传感器和控制系统,小姜制作的咖啡能精确到每一滴。

不过,目前,达闼推出的机器人足部仍然是单柱形态,非双足的人形姿态。它的使用场景,主要应用于商场、银行、展会、养老院等迎宾场景。

优艾智合高原科考机器人ARIS-8848

机器人ARIS-8848很酷,它曾攀登珠峰。

去年五月,为了保障气象科考队在珠峰的气象考察工作,优艾智合基于巡检机器人的技术框架和商用案例积累,花费一年进行产品设计与打磨,推出了高原科考机器人ARIS-8848。

优艾智合-攀登珠峰

针对青藏高原的高海拔、超低温和复杂地形,ARIS-8848拥有履带式的移动底盘,可以在沙石、冰川等复杂路面运行,同时机身集成包括3D摄像头、激光雷达、红外摄像仪在内的多种传感器,能够识别复杂地形和障碍物。

除了攀登珠峰,ARIS-8848更强的是能在低温环境下运行,信号传输稳定,辅助科考工作顺利进行。

睿尔曼双臂复合升降机器人

睿尔曼其实是一家机械臂公司。

睿尔曼的双臂复合升降机器人,则被定位为家庭服务管家,当你需要一杯水,机器人会帮你从厨房取出来端给你,当你需要整理杂物,机器人可以按你的指示,自动收纳物品。甚至,晚上你躺在床上,懒得起床去关灯,喊一声机器人就行了。

为了让机械臂更贴近普通用户的家庭场景,睿尔曼对核心零部件采用了全链路、强耦合的设计方式,达到了本体自重6Kg(含控制器7.2Kg),额定负载5Kg,负载自重比达到1:1.2,最大负载9Kg的极致性能。

同时,睿尔曼把大模型产品接入机器人操作系统,提升了语音交互体验。

睿尔曼双臂复合升降机器人

云深处科技绝影Lite3和X20

巡检,是机器狗的常用场景。

展厅上,云深处带来了绝影 Lite3和绝影X20两款产品。

绝影 Lite3主要用于教育科研场景,可帮助呈现编程效果。绝影X20则是一款电力巡检和特种应用机器人。 Lite3展现了翻跟头的绝技,绝影X20也展现了上楼梯的效果。

绝影X20最快速度4.95m/s,能负重20 公斤,可以上 20 公分的楼梯,跳过宽 1 米的沟壑,且在废墟里也能行走。

云深处科技~绝影四足机器人

绝影 X20 拥有IP66的防护等级,工作台可以搭载双光云台、机械臂、调试架、4G/5G 模块、北斗/GPS/RTK模块等,环境感知方面可实现自动的目标检测与识别,搭配深度相机、激光雷达和智能算法,可实现精准导航、动态避障和人机交互等功能。

当下,绝影X20与电力巡检和特种应用这两大场景结合紧密。绝影X20能完成从自主规划路径,到采集巡检数据、生成巡检报告,再到自主充电、循环作业的全流程巡检。在消防侦查场景,绝影X20能灵活开展无人侦查和搜救工作。

微创机器人

机器人也可以做手术了,还能远程操作。

“图迈”胸腔手术机器人,是外科医生的好帮手。这款机器人由上海微创医疗机器人公司自主研发,是目前唯一一款由中国企业研发并获批上市的四臂腔镜手术机器人。

“图迈”已经在全国 20多个省份的40多家医院,完成了超过 1000 多例的临床验证,手术全面覆盖了胸腔、腹腔、盆腔的一系列高难度微创伤。在手术过程中,“图迈”可以帮助医生做到精准识别、精准切除、精准解剖。

微创机器人

“图迈”在5G超远程手术方面也得到临床研证。据介绍,2022年6月11日,“图迈”连接横跨近5000公里的新疆克州和江苏南京,顺利完成两例泌尿外科超远程手术,实现迄今为止世界最远距离的5G远程机器人手术。

展台工作人员介绍,与进口手术机器人相比,同等性能下,图迈的成本价格“有非常大的优势”。

三、这些硬件可能改变未来

科技总是先成为创新产品,再逐步迈入生活。

大会上也展出了一些好玩的,能改变大家日常生活的新科技产品。送外卖的无人机,还有新的掌中付款码,还有自动控制的轿车充电器。

随着商业化的进展和推广,他们可能会从科技展厅飞入大家的生活。

美团第四代无人机

为了送外卖,美团把无人机都用上了,将自动驾驶用到了极致。

美团展出了最新的第四代无人机,采用六轴飞行器,最大载重2.5公斤,满载最大配送距离10公里,3公里半径内的外卖配送时间一般不超过15分钟。

美团第四代无人机

和上一代相比,新机型除了性能更佳,对环境的适应性也更强,即便在“零下20度至50度”的雨雪大风天气,也能安全运行。

目前,美团无人机仅在深圳、上海等城市落地15条航线,更多还是配合外卖员完成日常配送。

微信刷掌支付

在机器视觉能力的加持下,付款方式正一步步被改变。从最早的相机扫描二维码,再到人脸识别。如今,微信又推出了刷掌支付功能,识别更为细致的手掌纹路。

微信刷掌支付

有了微信刷掌支付,只需要录入手掌纹样,在消费时,伸手就可以完成支付。相比刷脸支付,刷掌支付无论在安全,还是精准度上,都要更高一些。

据报道,北京的部分地铁线已经上线刷掌乘车服务,乘客伸手即可进出站。

关键词: