“戴上眼镜,我可以一边逛展,一边看到二维码扫描出来的数字信息,了解更多展品的细节。”
在进博会的人工智能体验区,不少参观者戴着一款智能眼镜开始逛展。
这款智能眼镜,是由奇点临近打造的全天候智能眼镜。11月8日,奇点临近开售了qidi one开发者版(qidi one infinity edition),价格4999元起。
全天候智能眼镜的第一步:户外室内都能用的一体机
奇点临近创办于2021年12月,创始人兼ceo张慧敏曾是华为p和mate旗舰机核心开创者之一,也是华为手机第一位首席科学家、第一位首席架构师。
继去年亿元级天使轮融资后,今年7月,奇点临近又拿下了阿里的数千万元战略轮融资。在见证并深度参与消费电子多次产业升级后,张慧敏认为智能眼镜将成为下一代智能终端,而一款真智能眼镜需要具备以下特点:
眼镜形态,要舒适轻便,长时间佩戴,适应日常工作生活各个场景;第一视角的感知和识别,自带算力和电池能量;即时全息显示,融合数字世界和现实世界;裸手交互,符合自然直觉。
张慧敏认为,要做好创新,必须对底层技术有深入思考,对人性和用户有深刻洞察,想清楚最终产品应该是什么样,能给用户带来什么价值和体验,再top to down地向下拆解所有关键技术及模块,在关键技术上做创新,在关键技术之间做系统性的架构设计和k8凯发推荐的解决方案,再回到终端产品,实现从需求到技术再到产品的闭环。每一代产品,都沿着拆解关键技术后形成的roadmap,先行一步解决至少1-2个用户最在意的关键底层问题。
qidi one开发者版就是他对真全天候智能眼镜设想的初步实践,这一代产品优先解决的是两大问题:一是实现高透高亮,必须保证户外无遮光片也可正常使用;二是做成一体机,且尽可能轻巧,舒适便携。
qidi one开发者版重量在80g左右,是自带算力电池存储的一体机,采用lcos 双目阵列光波导的光学方案,显示亮度最高能够达到3000nits,分辨率1280×720,透光率大于85%。在轻度使用场景中,qidi one开发者版的续航能力能够达到3-4小时左右
△来自qidi one infinity edition官方介绍
ar ai打造创新功能,兼具强大兼容性
围绕高透高亮、重量轻、一体机三大特征,奇点打造了qidi one开发者版本的一系列亮点功能。
比如能在进博会上实际体验到的ar名片功能:
戴上智能眼镜看朋友,它会极速识别朋友的身份信息,并随之展现在你的面前。
上传朋友信息至智能眼镜的过程也很便利,只要通过手机直接扫描各式各样的名片,同时将人脸照片上传即可。下一次无论何时何地,奇点临近智能眼镜都能帮你识别出ta,堪称“社交神器”。
ar翻译也很简单,单击开始,就可以即时看到转录出的翻译文字。ar大模型更是随身百科全书型的利器,直接提问,大模型的回复就会即时显示在眼前。
第一视角拍摄不是什么新概念了,但过往的拍摄方法,例如把运动相机顶在头上、戴着胸前,或者采用摄像头放置在镜腿上的眼镜型设备,最终成片和实际肉眼所见存在视差。
奇点通过硬件和算法的创新优化,实现零视差第一视角摄录。进博会现场体验中,可以明显感受取景框中的画面、最终拍摄到的画面,和肉眼所见基本一致。
除了基础功能,还有一些有趣的玩法。例如旨在打造沉浸式户外健身功能的应用libra,可以根据你的心情、环境选择适当的歌曲类型,边听边徒步,眼镜会实时提醒你走了多少步、消耗了多少卡路里,主打一个及时激励,还可打开摄像头,实时记录所看到的画面。
另外,还有实用的ppt提词功能。演讲词实时显示在眼前,还能通过指环,实现隐藏式手动翻页,不用斜眼看提词器,不用害怕看不清,更不用担心后台翻提词的工作人员翻错页,日常工作场合也能使用。
不仅如此,qidi one开发者版本能够呈现4米外85寸大屏,这也为其作为拓展性设备提供更多可能性。比如switch、xbox打游戏;连接无人机,直接看到无人机的拍摄画面;手机、电脑更不在话下。
底层技术创新,赋能千行百业
在智能眼镜中,奇点临近通过不同的app向用户以及开发者们展示其显示、语音算法、图像算法等底层技术所提供的强大能力。
“我们希望通过展示这些成果,让更多人能够通过我们所提供底层能力、底层技术,去开发适合他们所在行业的应用。”张慧敏说道。
在显示方案上,奇点智能眼镜选择了lcos 双目阵列波导的ar光学方案。为了降低lcos的功耗,奇点智能眼镜严格选择所有关键器件。据张慧敏介绍,某个同一位置的关键部件替换,可以实现同等功耗下提高30%亮度。选择lcos方案的另一大原因是,能够支持85%透光率,且其入眼亮度能够达到3000nits,奇点智能眼镜在不需要遮光罩的情况下,能够满足大部分的室内、室外场景。
奇点自研的,拥有独立知识产权的自标定双目合像方案,实现了分体式左右显示模组的双目合像。通过结构定位,软件自标定的方式,突破硬件极限,将双目合像的精度做到了5’,并实现了行业首创的合像距离可调模式,达到行业领先水平。
在交互方案上,奇点智能眼镜拥有语音、触控两大交互方式,也可选配指环。大家都知道语音交互比较容易受外界环境所影响,出现短暂失灵的情况。通过奇点临近的语音声纹识别算法,能够让智能眼镜在声音比较嘈杂的地方,识别智能眼镜用户的声音,从而执行响应的指令。“目前我们的物流客户在仓库、机房里已经进行了上万小时的使用,语音指令基本能获得准确执行。”
据介绍,奇点临近已经形成了一套行之有效的、多模态复杂场景的、轻量化小模型的环境感知万物识别的算法应用体系,通过基于应用场景的camera定制开发、软件多线程框架设计及优化、深度学习算法arm/gpu融合优化等软硬件一体化的开发,将行业中目标检测识别算法提升了十倍以上,实现0.1s的极速识别,达到行业领先水平。
在张慧敏看来,无论是物流、文旅等商用市场,还是消费者市场,奇点智能眼镜都是为人打造的产品,因此都有共同的需求,比如说重量。
“我们认为用户对眼镜的重量其实是非常敏感的,哪怕是多重3g或者多重5g都会影响用户的佩戴时间。因此我们在眼镜的重量上,下了不少功夫。”通过深度定制二三级的零部件,并且在系统工程一体化上反复打磨,目前qidi one开发者版本的重量在80g左右。
△qidi one开发者版媒体实测
图像识别能力、语音交互能力以及显示能力,都是奇点临近为千行百业提供的“百宝箱”,支撑着各行各业将他们的创新想法落地实现。
对话张慧敏:造智能眼镜≠造手机智能眼镜范式或呈多样化
智能眼镜,是张慧敏职业生涯中进入的第四个创新性赛道。从白电(冰箱、洗衣机等白色家电的代称),到功能机,到智能手机,再到智能眼镜,张慧敏已经非常熟悉如何从0到1搭建自己的团队。
△奇点临近的创始人兼ceo张慧敏
据他透露,目前奇点临近有不少来自于华为旗舰机、大疆等顶尖团队的员工,并且他们还拥有一个相当优秀的嵌入式算法团队,帮助他们将各类应用轻量化“塞入”智能眼镜中。“有些关键技术难关,就需要找到专业的人来攻克,这也是k8凯发推荐的优势所在”张慧敏说。“终端厂商是推动行业向前关键的一环,只有他们才知道用户真的想要什么。”多年的终端研发经验,让张慧敏不满足于停留在等待供应链技术成熟的层面,反而选择进一步推动供应链提升自己的工艺,共同打造出好的产品。
作为曾经见证手机如何从功能机转向智能手机的关键人物,他表示,智能手机时代,屏幕内、外是割裂的,数字归数字,现实归现实,它更像一个平台,集合了各种不同的app;但智能眼镜是把屏幕内的数字信息和屏幕外的现实融合在眼前,实现1 1>2的效应,在应用方面,未来将实现场景驱动,而不是依赖人的主动触发。智能眼镜和智能手机的硬软件产品范式都会不同,核心技术也不同,造智能眼镜的思路不能完全照搬手机,但可以从定义产品的底层能力,选出超越用户期望的使用场景等方面借鉴手机创新的方法论
据他推断,未来智能眼镜的范式可能不只1种,可能有2-3种类型。“我们希望奇点临近能够定义其中1款。”在他看来,如果一款智能眼镜能够在不亏本、不营销的情况卖出50万台,这可能意味着智能眼镜即将迎来爆发阶段。当ar产业达到成熟阶段时,可能会拥有15-20家进入智能眼镜赛道终局。
从2021年成立,到奇点智能眼镜量产上市,再到2023年11月公开发售qidi one开发者版本,奇点临近交上了自己的产品答卷,通过qidi one开发者版本直观向千行百业的人员展示智能眼镜能够提供的底层技术能力,并推动他们加入开发创新应用的队伍。在日益升温的智能眼镜赛道,期待qidi one开发者版本给行业的开发者带来新的工具、灵感和体验。
— 完 —