3

十年浮沉录 | 对话谷东科技崔海涛:为什么说AR是AI大模型落地的最佳载体?

 1 month ago
source link: https://www.vrtuoluo.cn/539734.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

十年浮沉录 | 对话谷东科技崔海涛:为什么说AR是AI大模型落地的最佳载体?_VR陀螺

1660873568898%E5%BE%AE%E4%BF%A1%E5%9B%BE%E7%89%87_20220819094503.jpg
推广
十年浮沉录 | 对话谷东科技崔海涛:为什么说AR是AI大模型落地的最佳载体?
发布时间:16小时前  |  标签: 创业 AI 工业AR 谷东科技 应用落地

文/VR陀螺

XR行业,十年一征程。

2014年,Facebook收购Oculus,后更名Meta "All in 元宇宙”;2021年,字节跳动收购PICO,揭开国内VR领域的新篇章;2024年,苹果携Vision Pro入局,引领业界迈入空间计算时代……

回顾过去的十年,从一开始单纯的VR、AR,到后来出现MR、XR,再到如今与AI相结合以及空间计算概念出现,XR始终在不断向前发展中,其应用领域也从游戏到教育办公、工业制造、医疗健康等,不断革新各垂直领域的智能交互体验,成为21世纪的新质生产力。

经历了上一个十年的企业家们,有何经营之道?而面向未来十年,XR又将如何前行?

基于此,VR陀螺推出了以“XR 十年沉浮录”为主题系列线上直播访谈活动,4月9日,VR陀螺 主编兼总经理 案山子连线对话谷东科技 创始人兼CEO 崔海涛,双方就“大模型浪潮下工业AR+AI的实践与挑战”进行了深入探讨。

1713752299984%E5%9B%BE%E7%89%871.png

以下是对话实录:

案山子:今天我们直播间有幸请到谷东科技的创始人兼CEO崔海涛,崔总在这个行业里面其实已经扎根多年,并且谷东科技前几天刚发了一款工业AR智能头盔新品H4000。这里首先有请崔总做一个简单的自我介绍。

崔海涛:我先来介绍一下谷东科技,我们公司在2017年底成立,从一开始便专注于AR显示、算法和硬件方面的技术研发。我们在B端落地方面其实也经历了很多困难,踩了不少坑,不过一路走来整体还算不错,很多国内外的一些头部企业都是谷东科技的客户。

现如今,我们已经把AR真正应用在了生产、制造、检修、售后、培训等诸多领域。可能对于一些直播间的观众来说,由于我们从事的是B端,跟大家直接面对面接触的机会比较少,不少人仍然会认为AR仅仅用于展示、培训等简单场景,然后我今天也希望借助这次对话机会,给大家介绍谷东科技在企业端的各种实践经验以及一些心得体会。

1713752380389%E5%9B%BE%E7%89%872.png

谷东科技H4000新品发布会(图源:谷东科技)

案山子:如果我们回看VR/AR这十年,你会发现整个产业其实一直在起起伏伏,有很多老公司退了出去,也有很多新的公司进来。在这样一个环境里面,当您回顾您这段创业经历,甚至说有机会回到上一个时间节点,您还会选择这个赛道并坚定投入进来吗?

崔海涛:从现在来看,下场AR创业其实属于有点冲动的,因为我们在进来这大几年时间里,踩了非常多的坑,也经历了非常多的行业困境,里面的难度其实远超我最初的想象。即便从当前的时间节点来看,AR/VR依然没有那么容易做,里面还有很多诸如技术挑战、应用场景挑战等,非常考验创业者以及团队的综合能力以及韧性。我觉得当初如果没有一定的心理准备和创业韧性,以及对业务对心理的建设能力,其实是挺难挺过去的。

案山子:面对当前情形,如果现在有人想进来创业做AI或AR终端的话,这个时间点你会鼓励他进来吗?

崔海涛:我觉得永远有高人在,以后可能确实会有一些比我们从业能力更强、资源更强的准备入局VR/AR的创业者,所以很难一概而论。不过从我们对行业的观察来看,我们看到了很多的企业生与死,我感觉VR/AR创业难度其实比一般的创业要相对更难,因为它的商业模式以及技术特别难掌握。

并且在这个阶段,行业也并非一个约定俗成的东西,需要自己去把握和探索,可能你踩错一步就会万劫不复。如果有创业者想要进来,我觉得还是可以的,但是需要选择一个自己非常确信的、看得明朗的点,你们也知道AR/ VR行业不乏障眼法,它并不像外面的人看起来那么美好。

1713752413529%E5%9B%BE%E7%89%873.png

谷东科技工业AR智能头盔H4000(图源:网络)

案山子:崔总在创办谷东科技之前曾做了一个叫VR/AR看冬奥的项目,我相信这也是促使您创业的一个契机。为什么当时会从AR的角度切入创业,而不是VR呢?当然从现在来看,增强现实不止AR这一条路径,基于VST的VR也有一些比较不错的效果了,我想了解一下在VR/AR赛道的选择上你都有哪些初衷或者考量点?

崔海涛:当年的VR其实连VST概念都很少被人提及,透视技术也远没有今天这么成熟。对我个人而言,我是有点幽闭恐惧症的,在VR这种全封闭的环境中,我会感觉非常不舒服。另外VR的体积重量也比AR夸张得多,佩戴这么大、这么重的VR对我来讲是一种绝对的负担,没有享受。

因而哪怕VR能力更强,我也宁愿选择一个比较轻便的AR,所以创业之初就没考虑过做VR。如果有关注谷东科技的就会发现,我们创业之初就跟现在大多数刚进来的创业者一样,一开始做的也是符合我们日常佩戴习惯的眼镜类产品。

当然,现在Vision Pro出来以后,很多人会发现它的透视效果其实做得也已经十分不错了, VR和AR的界限越来越模糊,也就是大家都走到了MR这么一个十字路口。VR/AR相较于以前也不是那么泾渭分明了,所以我觉得既然大家都能走得通,后续做产品更多地可以针对不同人群、场景和资源去考量。

1713752448037%E5%9B%BE%E7%89%874.jpg

谷东科技早期产品(图源:网络)

案山子:前面提到Vision Pro,很多人也感受到了VST其实也能做AR方面的一些事情,那么苹果Vision Pro出来后对谷东科技的业务有冲击吗?另外你又是如何看待未来VST跟OST的发展的?

崔海涛:其实冲击基本不存在。我们谷东科技是一家专注于服务ToB市场的AR+AI技术公司,像苹果Vision Pro这样一类VST产品,它基于摄像头观察,大家对它的不信任感还是会有的,而且从目前的法律法规来看也不允许这么做,B端场景还是要求用裸眼对周边环境进行判断,需要人保持这种感知,所以当前阶段基于摄像头取代我们的感官其实是不可行的。

另外Vision Pro的VST是不是已经尽善尽美了呢?其实也没有。它在一些暗光、低光的环境下效果会大打折扣,在这种情况下更不能用它来参与甚至替代工业场景里面的一些作业行为了。

所以我觉得VST对我们倒没有什么冲击,但是对于行业创业者来讲,这不失为一种产品思路,可能有些消费端的用户他就希望有时候能够获得完全沉浸式的体验,有时候又可以戴出去吃个火锅、包个饺子,那VST也不失为一种可以接受的方式,如果它的体验足够好,也是有很多消费者可以接受的。也就是说在使用场景方面,如果环境不是十分苛刻,我觉得无论是VST或者OST,都是可以的,实际上它们已经在很多场景上出现了重叠,比如娱乐、教学、培训等。

当然考虑到Vision Pro这类VST产品,它的重量跟佩戴对很多人来说还是难以接受的,背后我们不能忽略当前的供应链以及技术水平。最理想的情况当然是用10克左右的glasses实现各种复杂的功能和空间计算,但是它现在还太远,只是看如何取舍。

1713752477829%E5%9B%BE%E7%89%875.jpg

Vision Pro(图源:VR陀螺)

案山子:谷东科技选择的是AR路线, 我们都知道AR里面涉及到的光学非常多,比如之前的棱镜,到现在的Birdbath、自由曲面,以及衍射波导、阵列波导、体全息波导等,光学方案一直在不断地推陈出新,您在定义产品,或者说考量产品跟场景之间关联的时候,会怎么去选择它的光学方案?您对于不同的光学都有哪些看法?

崔海涛:我在一两年以前还会认为,很多AR光学方案都可以用,在前期我们也尝试过开发不同的产品,它们配有不同的光学。但到了现如今,我觉得AR光学的方向已经越来越清晰了,现在好像就只剩光波导可以选了,特别是当你拿光波导对比其他AR光学方案的时候,你就会知道它不愧是显示之王,它的各种优势是别的方案没办法去比较的。

以前我还认为观影用Birdbath、自由曲面还挺好的,但是真正看到光波导的发展以及进展的时候,会明显感觉后者使用起来更舒服。当然谷东科技也在从事光波导方面的技术研究和开发,这并不是我为自己打广告,实际上光波导很多优势你是没办法忽视的,比如超轻薄、看外界环境没有畸变、眼盒可以做到很大、造型对于佩戴非常友好、教育成本很低等。

随着光波导技术优化迭代,它的色彩、显示以及空间交互会进一步提升,你会感觉它跟真实世界的融入感更强,甚至会让人忘记自己戴了这么一副眼镜。所以我觉得即便大家现在还在纠结,几年过后,我相信很多人最终还是会领悟过来:光波导才是终局。

案山子:这背后是不是因为光波导在近几年出现了特别大的进展以及技术突破,从而让你改变了自己的想法?还是说有什么其他原因打动了您?

崔海涛:这背后跟客户的意见和反馈有关。我们作为从业者可能会一叶障目,我们的意见不一定是对的,不过我们也做过很多调研,拿过不同的光学产品去拜访我们的客户,让我比较震惊的地方在于,当他们看到光波导以后,就再也不会去看别的光学显示方案了。

当然,最近我们在光波导显示技术方面也取得了很大的进展,比如在亮度、颜色的饱和度对比度、眼盒、出瞳距等指标上有了提升,原来光波导的很多固有问题也开始得到了改善,除了谷东科技以外,我们的同行们在光波导方面也取得了很多突破,整个行业都在进步,所以我觉得现在光波导已经没有什么可犹豫的了。

1713752517003%E5%9B%BE%E7%89%876.png

谷东科技在光博会展示光波导模组(图源:网络)

案山子:经过这么多年下来,你觉得B端客户对于AR类产品,它们的想法有没有转变?当然我们也知道B端其实是一个比较难推的领域,你觉得现在的市场渗透率又达到了什么样的一个水平?

崔海涛:首先从认知和市场教育来讲,B端客户相较于前几年确实有了很大的提升。现在很多客户都知道AR、VR的区别了,而不会像前几年一样还傻傻分不清。再者他们对于AR的一般功能以及作用已经具备大概认知,比如会考量这个产品戴起来舒不舒服、屏幕看起来清不清楚等。

但是在更细化的方面,比如如何用AR结合自己的行业,如何将AR真正落地到生产实践当中,一些制造方面的困难如何借助AR解决,AR能解决到什么程度等,这些他们还没有概念。这些东西光靠讲其实很难打动客户,后面还是需要真正给他们做展示。特别是现如今AR结合AI以后,它确实比手机、Pad或者其他的手持终端要具备更高效率。所以我们在很多客户那里其实是起到一个布道者的角色,先做市场教育,然后才有后面客户的认知和连续购买。

案山子:结合过往来看,在说服或者教育客户的过程中哪些地方会具有比较大的阻力?

崔海涛:我觉得客户的耐心是比较大的阻力。很多时候AR需要在特殊的场景下才能体现出它的价值,可能一些客户它刚开始的时候不会使用,或者说没有完全理解,并且在原有观念中认为AR只能用于简单的扫码、识别零件或缺陷等。如果客户真的试图将AR融入到工作流当中,其实很容易就会看到它由量变到质变,从单一步骤的提效再到整个工作效率的提升,不过有很多客户在这个过程中浅尝辄止,十分可惜。

当然我们也不会轻易放弃,当我们有新的idea或方案,我们也会随时给客户展示。可能第一次他感觉这只是一个小进步,但第二次再看的时候,客户就会觉得提升十分大。所以这里面比较核心的还是客户的耐心问题,当然这背后也需要我们行业从业者用耐心去浇灌客户。

1713752549512%E5%9B%BE%E7%89%877.png

谷东科技C2000(图源:网络)

案山子:关于产品,我们会发现B端视角跟C端视角是完全不一样的。比如说我们C端用户去买眼镜,他心中会有自己的一个排序,比如希望有好的显示效果,价格也要比较低等等。对B端客户来说,他们对于产品更侧重于哪些地方?

崔海涛:B端产品跟消费端确实有很大的差异,对于客户而言,我觉得他们首要关注的是场景的适应性或者说人机交互佩戴体验。因为工作跟躺在沙发追剧是不一样的,B端AR产品要用于真刀实枪地干活,不能耽误他的工作,同时也不要影响他的安全。

而且对于B端用户来说,产品一戴就是一上午甚至一整天,所以人体工学肯定是需要排在第一位的。还有对于一些诸如消防等特种行业来说,佩戴的可靠性也非常重要。比如用户戴着一副眼镜,时不时还要提防它往下掉,时刻得用手扶着,这种产品也是严重不及格的。

第二点,客户对于显示也是蛮挑剔的,我发现这里有一个很有意思的事情,刚接触客户的时候,你跟他讲再多的流程、功能其实都没有一个好的显示效果有用。你把产品拿给他们看,他们可能会觉得光波导这么一个透明的屏幕,里面还能显示内容,并且显示的效果也十分不错,他就会感觉这个产品很不错。当然,因为AR或者MR、XR,它们本质都是新一代显示技术,所以显示这一块对客户来讲是非常重要的。为什么传统的棱镜技术已经消失掉了,就是客户普遍觉得它显示不够好。

第三点,我觉得是AR摄像头的能力。摄像头是一个感知系统,它直接决定设备捕捉到的画面细节是否足够清晰以及能否用于后续的分析等工作流程,这些东西也是客户比较在意的。当然我们谷东科技最近发布的工业AR智能头盔H4000也非常重视摄像头能力,H4000用了4800万像素摄像头,支持工业级防抖以及外接变焦镜头等,我们在这基础之上还开发了图像增强算法,这些都是为了更好满足客户的使用需求。

再后面,客户可能看重的还有电池续航、发热,是否经过各种专业认证以及防爆、防尘、防水等安全认证等。总体来看,B端的产品相对C端要更复杂一些。

观众提问:对于C端行业来说,有没有值得分享的经验?

崔海涛:老实讲,我们对于C端不是特别专业,我们也不直接面向C端用户。不过从最基本的角度出发,AR眼镜是给人戴的,所以还是要以用户的感受作为出发点,要有一个同理心,如果你把产品做出来自己都不想用,我觉得最好也不要强加给用户,毕竟己所不欲勿施于人。我本身也买了不少C端的AR眼镜产品,虽然不方便直接评论产品好坏,我觉得它们有一部分做的还不错,不过也有一部分确实体验没那么好。

1713752587184%E5%9B%BE%E7%89%878.png

谷东科技工业AR新品H4000(图源:网络)

案山子:前面你有提到用户对于用AR取代Pad的需求,你觉得AR相对于Pad等传统屏幕,它的提升在哪里?

崔海涛:早些时候,我们很多工作都需要依赖纸和笔,比如物业、巡检等场景要用纸和笔签到、打卡,甚至连飞机检测等比较高端的地方还会用纸和笔记录,现在还有很多地方能看到纸和笔的身影。本来这些场景是没有屏幕的,不过屏幕出现后能给他们的工作增加很多便利性并提升效率。

现在用Pad、用手机等场景已经十分常见了,不过由于需要用手拿着,在某些时候还是非常不方便,比如说物流场景,工人搬完箱子以后紧接着要掏出Pad或手机扫码,这个效率显然是比较低的,所以这些工作场景下用AR取代Pad来解放双手就显得更有必要。另外,我们考虑到现如今AI深入人心,AR+AI深度融合,就像是随身佩戴了一个随时待命的助手,这对于一线人员后续的工作也将带来巨大的价值。

案山子:能否简单介绍AR已经落地的场景?

崔海涛:谷东科技发展至今,在这方面其实已经积累了大量的实践和案例。我们发现AR可落地的地方实在是太多了。举例而言,售后和故障排除这样的场景是最容易理解的,因为这个场景用户需要全身心投入抢修,专家要远程指导工人安装设备等,这时如果还要翻手机或Pad看手册或说明其实并不实际,而AR却可以很好解决这一类问题。

随着现如今CV技术的成熟,AR眼镜也可以参与到检查巡检等流程中,具有一定的指导和纠错能力,相当于拥有了一个实时的专家或者监督者,另外在一些复杂的装配环节,比如飞机整装车间,AR眼镜也可以用于辅助识别这种复杂的零件,提供安装顺序指导等。

1713752622978%E5%9B%BE%E7%89%879.png

AR+AI在航空领域落地(图源:谷东科技)

另外像一些企业的仓储物流环节,很多企业考虑到成本的因素不会像专门的物流企业一样那么激进用上全自动化,那么AR眼镜在这个场景的价值就体现出来了,比如前面提到工人搬货场景中,他们需要把东西提起、放下,腾出双手找Pad扫码,拍摄完还要录入,这起码需要经历四个步骤,而AR眼镜介入后,工人拿起箱子,眼镜自动扫描、语音录入后就可以出货了,步骤明显少了很多,所以在这个场景下AR对工作效率的提升也是非常明显的。

再比如海关等涉及检查的场景,引入AR后可以解决自动检索和数据孤岛问题,早些时候检查一个货物,可能要专门去找报关单、企业商标、价格等方面的资料,这些信息都需要去检索然后人为加工出来,现在借助我们谷东科技的AR+AI大模型技术可以对货物进行一个全方位的检查,确保符合相应的标准,这种场景下效率也有很明显的提升。

案山子:我们之前其实也跟蛮多这种做B端的企业聊过,一些客户购买AR眼镜可能更多只是起到展示作用,但是真正投入到实际生产中会少一些。你觉得现在还会有这种情况吗?

崔海涛:我觉得现在基本不会有这种情况了,因为大家对AR的认知已经过了初期好奇、猎奇的阶段,现在核心是讲究时效,我们很多项目都是以提升客户效率为目标。现如今客户对于每一分钱都算得十分清楚:你能把我生产效率、分拣效率或者查验效率提升多少?时间能压缩到什么水平?流程的优化以及智能的算法又能做到什么程度?甚至面对一些激进的客户,我们还需要签署相应的效率保证书。

1713752654127%E5%9B%BE%E7%89%8710.png

AR在制造场景(图源:网络)

案山子:咱们今天的主题是大模型浪潮下的工业AR+AI实践与挑战,这里也想跟崔总聊一聊AI相关的东西,谷东科技这边也在做AI相关的布局,所以想问一下,从当前来看,AR+AI都有哪些容易让用户感知到的或者能明显发挥价值的场景?

崔海涛:说到AI,可能现在最火的还是ChatGPT,它推出来已经有很长一段时间了,不过我不知道大家现在还会不会经常用。可能刚出来的时候大家都体验了,觉得AI能帮我写一些东西,或者跟它聊天觉得挺有意思,但是这个新鲜劲一过,大家持续使用的意愿就变弱了。

我觉得,想要让AI更好地融入到你的生活和工作里,AR才是绝配。以手机体验来看,你要经历解锁、输入对话框,用手拿着等操作,所以用户会觉得麻烦,人一旦觉得麻烦就不会经常去用,AR这种载体会好得多。

1713752682455%E5%9B%BE%E7%89%8711.png

图源:谷东科技

那我们如何将AI引入B端的作业呢?比较典型的是基于深度学习、CV去辅助产线工人识别零部件,检查缺陷等。在这个过程中,AI还能通过调用知识库基于过往经验给工人推荐相应的解决方案,即便在一些相对弹性、动态的场景也十分实用,它能降低决策成本,甚至某方面来看,AI的决策效率会比真人更高。

另外有一些工厂,它出于保密等原因严禁工人将手机带进工厂,很多时候工人查找资料需要跑到专门的计算机房,这也会浪费大量的时间。而AR作为一个先进的生产工具,它可以帮我们解决这种快速检索查询等问题。AI出现后,你可以用语音直接跟它对话交流,由于它具备较强的语义理解和归纳能力,用户在查询的时候不再需要输入固定的查询语句或者格式,所以对于检索数据等场景,AI也是非常有用的。

当然AI在智能眼镜上所发挥的作用远不止这么多,我们发现部分一线生产人员用了AR+AI以后,他会对这种东西有所依赖,因为AR设备对于一些弱光或者远距离识别效果甚至会高于人眼,而设备所识别到的条形码等信息又能直接显示在屏幕之上,相比手机确实会好很多。

在大模型布局方面,谷东科技在AI算力、算法以及数据层面均有相应布局,我们正在构建AR+AI大模型的场景落地以及算力联盟,前者配备了包含Llama 2、StableLM在内的近百种成熟AI算法,可以为客户提供针对性的AI解决方案。算力联盟则是谷东科技计划联合其他厂商推出的算力综合服务,目前已经积累了包含英伟达、华为体系在内的一些算力资源。

在大模型前沿基础研发方面,我们不仅在大模型应用研发层面为解决客户难题而探索和奋斗,也在为大模型前沿基础研究的发展做贡献。我们研究的主要方向包括模型架构的突破、大模型的轻量化、针对小样本更高效的指令微调方法以及图文多模态大模型。

大量实践下来,我们发现,算法创新的研发投入、算法的工程实现以及如何调整算法让它更有效地工作是当前大模型领域的主要难点。同时,要研发一个好的行业大模型,需要大量的行业专业数据积累,谷东科技跟B端各垂直领域客户的大量接触与合作获得了很多行业场景的一手真实数据,这是我们布局AR+AI大模型应用的优势之一。例如,针对大模型推理能力强计算能力弱的问题,谷东科技研究在大模型的下游引入专业领域的数据统计和计算模块,像是趋势预测、排产排班等,对企业不断生成的数据,通过引入持续学习和遗忘管理机制,定时在本地进行大模型的持续微调。

通过布局大模型技术研发及应用,我们希望能够为工业/企业提供更全面智能的AI解决方案,帮助他们提高决策效率和准确性、优化操作流程减少成本、开展自动化生产和机器人应用等。目前,谷东科技AR+AI大模型已率先在航空、石油、烟草等行业落地应用,解决了客户某些场景下操作说明检索和计划自动变更等问题。

1713752743525%E5%9B%BE%E7%89%8712.png

AR应用于智慧电力(图源:谷东科技)

案山子:前面提到的很多AI场景训练,其实都需要依赖于数据库,那么对于客户来说,是否会担心数据训练过程中产生的隐私和幻觉等问题?

崔海涛:数据安全性问题其实也是我们要帮客户考虑的首要问题之一,如果客户对于数据的安全性有很高的要求,我们会以私有化的方式去部署。

其次,我们面对的客户其实都是各种垂直行业的,我们训练的其实也叫做垂直行业小模型,我们不会用那种模棱两可,或者会导致AI胡言乱语的数据去训练客户的大模型,我们会基于大模型的思想以及一些核心算法逻辑,再运用一些行业实践中真实产生的数据去训练。其实我们很多客户它原先就已经采集了很多图像、报表之类的数据,只是先前没有进行系统利用,而大模型的诞生刚好可以把这些数据综合利用起来。

第三,对于输出结果的确定性,我们谷东科技在这方面也做了一些技术研究,我们在大模型的基本框架基础上加入了一些检索增强的算法,我们会把确定的规章制度或者需要严格遵守的行业规定作为优先项,先让AI检索这里面的内容。如果没有硬性要求,或者说依赖于老经验,决策所依赖的是工作中约定俗成的东西,没有特定的标准或者物理定律,那么我们AI会通过学习和吸收过往经验,再给新手输出相应的建议,这就相当于新手直接获得了与老员工一样的经验,这也会提升工作流程的安全性和效率。

例如,我们借鉴RAG技术,使用客户提供的资料先在文档中根据提示词做相似向量检索归类,再生成提示指令,对预训练的语言大模型进行指令微调。这里我们完成的训练都是在私域进行的,涉及的研发工作主要是对算法进行调整让它更有效的工作以及算法的工程实现,包括文字向量化方法、语言向量相似度搜索以及如何生成有效的提示等。在保证客户数据安全的前提下,解决了通用大模型对专业领域知识的局限性以及由于专业知识不足产生的幻觉问题。

1713752774695%E5%9B%BE%E7%89%8713.png

AR在能源领域(图源:谷东科技)

案山子:标准化一直是B端的一个难点,因为里面涉及了很多项目,需要跟不同的行业打交道,把项目变成产品其实是B端产业一直想要实现的目标,崔总在这个项目产品化的过程中,有没有可以分享的经验?

崔海涛:作为AR+AI设备和技术提供商,我们肯定希望实现产品化和标准化,不过这个过程中需要适应各种生产环境和使用场景,想要实现标准化或普适性其实并没那么简单。我们的做法是会把项目里面获得的经验、算法或者技巧等,将它们拆成最小化的模块,这个模块我们基本上是封装好的,后面会根据客户不同行业、不同的流程的需求,将这些小模块像积木一样搭建起来。这样它既能满足客户的定制化需求,也能保证我们产品的标准性。

展开来看,这些小模块包含了我们积累的算法、一些流媒体的处理方式、还有不同行业预留的其他设备的接口、甚至是交互方式等。因为这些模块都经过了验证,已经相当成熟,其他客户上手时也会非常放心。

1713752804584%E5%9B%BE%E7%89%8714.png

谷东科技工业AR头盔H4000的模块化特性(图源:谷东科技)

案山子 :创业至今,崔总肯定也踩过一些坑,有没有一些印象深刻的,或者背后有没有值得分享的经验或者教训?

崔海涛 :其实太多了。即便到现在我们也在不断踩坑。AR眼镜这个产品,它涉及的东西要比其他普通电子产品更多,首先它的显示光学本身就是一个很棘手的问题,怎么做双目融合、怎么实现空间计算,它对算力要求也是比较高的,里面的挑战很大。另外AR眼镜还要考虑如何实现3D渲染、手势交互等,这些难度也相当大。再者,AR眼镜不是简单拿在手上的东西它是用于佩戴的,所以众口难调,如何满足不同人的需求也很难。

我觉得这些东西都是坑,甚至不小心踏进去就会万劫不复。对于从业者来说,我觉得还是需要尽量吸收自己的、还有行业以及供应链的一些经验,尽量让自己少踩一些坑,尽量多去联合或合作,避免自己每一个坑都亲自试了才知道。

观众提问:H4000这款AR头盔产品可以外接什么东西?

崔海涛 :最基础的是我们H4000可以叠加红外传感器,它能做到 10 米外的扫码识别,效果要比普通手机好得多,另外头盔还可以结合激光测距、探孔、柔性摄像头、变焦镜头等组件使用。

观众提问:对于XR行业,现在从哪些地方切入机会会更多?教育、文旅还是视频等等?

崔海涛 :因为行业还在不断发展,现在虽说大家在网上看到了各种AR应用场景,我觉得还是需要自己真正去实践去感受,因为不同场景应用也有所不同。当然我们现在已知的场景也只是很小的一部分,毋庸置疑未来AR会越来越重要,出现在更多领域扮演更多的重要角色,如比较前沿的无人机控制、无人潜水等都需要AR技术来解决,所以我觉得未来的想象空间无限。

案山子:今天非常感谢崔总来到我们直播间,今后我们的十年系列还会持续推出,我们接下来也会聊到更多的领域,希望大家多多关注。今天的直播到此结束。

投稿/爆料:[email protected]

稿件/商务合作: 六六(微信 13138755620)

加入行业交流群:六六(微信 13138755620)

版权申明:本文为VR陀螺原创,任何第三方未经授权不得转载。如需转载请联系微信:vrtuoluo233 申请授权,并在转载时保留转载来源、作者以及原文链接信息,不得擅自更改内容,违规转载法律必究。文中有图片、视频素材来自互联网或无法核实出处,如涉及版权问题,请联系本网站协商处理。

kj_50.jpg

元宇宙数字产业服务平台

下载「陀螺科技」APP,获取前沿深度元宇宙讯息


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK