智能眼镜这一被忽视的功能,已经离不开它。

2024-10-27

字幕是一种权利。



字幕,已经成为现代人的「外挂」。上下班吵闹,钓鱼容易露馅,学会走神,听与看并用,可以避免进度条白白走错路。


但是,对于某些人来说,字幕并不只是锦上添花。



当《失控玩家》的男主角戴上眼镜时,他看到了无法察觉的信息,不再是一个被动的人。 NPC。


现实中还有一种智能眼镜,可以提供「行走的弹幕」。尽管没有那么科幻,但是它也通向了一个信息量更大的世界。


你说的话我都能看到。


技术的意义在于,当上帝关上一扇门时,打开一扇窗户。


一个听障博主的开箱视频, TikTok 拿下了 80 万点赞,心愿得偿,喜极而泣,最纯粹的情感产生的力量,触动了素未谋生的观众。


视频来自:TikTok@chrissymarshall_


手里拿着一个盒子,一边笑一边哭,比着手语,努力地说出完整的句子:「多年来,我一直在等待这个盒子的技术。」


盒子里装着一副字幕眼镜,看起来和普通眼镜没什么区别,但是让她能做到。「看到」周围的声音,那些过去听不见的声音,变成了一行行亮绿色、科幻的字幕。


根据视频中的信息,博主使用的眼镜被称为 Hearview,今年专门为听障人士设计, 5 每月发布,一家国内科技公司,但不面向国内,市场在国外。


可用于娱乐、观看电影、观看视频、观看《黑神话:悟空》直播游戏。



从刷《老友记》的体验视频来看,文字略显滞后但准确,配对手机。 app 也可以区分不同的说话者。


同时也可以用于零距离对话,方便听障人士在餐厅点餐,在超市购物,和导购聊天,开车时导航。...




HearView 原理说起来并不复杂,还有手机。 app 通过智能手机的麦克风,匹配,捕捉声音,AI 即时语音转文字的算法,眼镜上显示字幕。


假如听障者需要回复他人,他们可以回复。 app 输入信息,将文字转换为语音。过去的字幕也存储在里面。 app 中。



HearView 声称,语音转文本的准确性达到 最远转录95% 10 米外的声音。谈到这里,一个问题呼之欲出:菜市场等嘈杂环境中的表现会不会变差?


尽管 HearView 表示手机 app 它具有消除噪音的功能,但是我翻遍了各种体验视频,在嘈杂的环境中找不到实测,所以无法探索效果如何。


网站只提到了一些参数信息,续航。 7 小时,重 52 适用于全天佩戴,还配有振动和视觉警告,提醒用户注意可能的危险。


轻巧耐用,听起来很想剁手,但是太贵了,很难交到朋友-1799 美金,约 12800 元人民币。



此外,Hearview还有很大的改进空间。目前只支持英语和西班牙语,计划支持德语和法语,无法实现语言的相互翻译。


文字的颜色只有亮绿色,虽然保证了在各种屏幕和照明条件下都可以阅读,但是顾客没有选择,就是美中不足。


但是存在意味着价值。字幕早就是很多人生活的一部分,这还不够。它应该以更方便、更直观的方式陪伴最需要的人。


虽然字幕眼镜很多,但是生活中的挑战更多。


实时字幕眼镜,其实并不是什么新鲜事,放在上面 2 几年前,甚至是一股热潮,诞生了许多有趣的项目,但是很难做到最好。


英国 AR 初创公司 XRAI,开发适配多种型号 AR 眼镜的语音转文本应用 XRAI Glass。


不过,《连线》杂志记者戴着一个和一个。 XRAI Glass 兼容的 AR 眼镜后发现,语音转文字固然好,但是在使用过程中,总会有这样那样的摩擦。


首先,使用体验。如果戴上人工耳蜗和助听器,戴上眼镜可能会不舒服,虽然这个 AR 眼镜已经很轻了,但是和普通眼镜相比还是很重的。



而且,在背景噪音大的情况下,语音转文字与多人交谈时,效果并不好,实用性受到影响。


价格也是个问题,300 多美元的 AR 眼镜已使钱夹隐隐作痛,XRAI Glass 而且每个月都要花费几十美元的订阅套餐,就像许多语音转文字的软件一样,只能说并不奇怪。


国内也有相似之处 Hearview 商品——视野开阔的听语者字幕眼镜,分为助听版和翻译版,能够理解普通话、方言和外语,并支持跨语翻译。



它的使用方法和 Hearview 类似,下载可翻译 app,蓝牙配对眼镜和手机, Wi-Fi 或者热点连接网络,移动端实时语音转文本,眼镜端显示文本。


但也有用户 App Store 反馈方面,听者对方言的支持还不够。这是一个非常必要但也很难的优化方向。听力差,习惯说方言的老年人最需要这个产品。



也有 YouTube 博主们发现,听者的语音识别率很高,速度也很快,但是如果口音很重,准确率就会降低。



图片来自:YouTube@科技助手


如果不局限于眼镜的形状,耶鲁大学和斯坦福大学的学生设计的产品原型很有意思,叫做 Transcribe Glass。


它不是一副眼镜,而是一个平视显示器,可以卡在眼镜的框架上,打开盒子就可以使用,设备可以连接到 iOS 和 Android 的配套 app,使用者选择适合自己的语音转文本软件。



生成的字幕将通过低功耗蓝牙传输到设备中,并在客户的实际视野中实时叠加。难得的是定价特别友好,95 美元,但是连测试版都还在替补,直到现在也找不到落地信息。



面向所有人的多功能产品,除了专注于语音转文字的产品。 AR 智能化眼镜,通常还包括字幕功能。


国内价格两三千的一体化无线智能眼镜,几乎都支持语音转换文本和多语种的实时翻译,但翻译效率可能不如专门为听障人士设计的。 AR 眼镜,持续开着语音转文字,电池寿命也是个问题。


我咨询了一个头部智能眼镜品牌,得到的答案是「听力障碍者不建议使用」。



10 月 22 日,咨询某智能眼镜品牌客户服务


事实上,这类产品最适合大厂销售,特别是 Google,语音识别,机器翻译和 AR 各方面技术积累深厚,即时语音转文字和翻译能力遥遥领先。



Google 在 2022 年 I/O 推出了一款可以实时翻译的产品。 AR 眼镜,支持 24 各种语言,甚至支持美国手语,字幕就在对话者旁边,不过也只是原型演示,没有下文。


技术向善是字幕眼镜的大前提,各种各样。「吹毛求疵」,事实上,抱着殷切的心情,希望商品不满现状,不断进化,再做一次,再改善一次,变得更好。


字幕是一种看世界就像看电影一样的权利。


根据世界卫生组织的统计,世界大约有 4.66 一亿人患有听力损失,其中超过 900 一万人患有严重耳聋。


即使使用人工耳蜗或助听器,听障人士仍然需要集中精力去理解别人在说什么。同时,一些发音相近的单词很难通过嘴唇阅读来区分。在理想环境下,英语只有大约。 40% 语音信息,可以通过说话者的嘴唇动作来捕捉。


正因为如此,一个听障的世界,需要文字作为补充。很久以前,就有人为之努力。


艾默生·罗梅罗,一位古巴裔美国默片演员,也是一位听障人士, 1947 2008年,有声电影的字幕被打开。



在无声电影时代,观众可以通过电影画面和插入的文字来了解故事。然而,当有声电影兴起时,许多像他这样的听力障碍观众失去了看电影的机会,因为他们听不到台词,电影缺乏字幕。


所以,罗梅罗决定自己手工制作字幕:当时的电影是通过电影播放的,他把电影切片,并在帧之间插入一个有字幕的图像。


后续的字幕技术可以看作是罗梅罗精神的延续,同时也有更多的设计方便听障人士看电影。例如,一些美国电影院提供预制字幕眼镜。


2012 2008年,索尼推出了一款为部分影院提供的电影。 CC 字幕眼镜,不同于普通字幕,CC 字幕不仅包括对话内容,还包括背景音乐、音效、环境声等非语言信息。



这个眼镜每边都配有一个小投影仪,绿色的字幕看上去就像漂浮在大银幕前。


无论观众坐在电影院的哪个位置,都能清楚地看到字幕。用户还可以调整字幕的亮度、显示距离和视角,转换六种语言。


这个眼镜甚至支持 3D,顾客不必多戴副眼镜观看。 3D 电影。这一点非常重要,避免了鼻梁忙碌的情况:同时戴普通眼镜,3D 眼镜、CC 看电影的字幕眼镜。



图片来自:Reddit@ellowTonkaTrunk,发布于 2022 年


这个场景有些讽刺,但就像一个隐喻——从一个普通的角度去了解这个世界,有些人总是需要付出更多。


还不够完美,但是未来可以期待的实时字幕眼镜,至少让我们看到了一种美好的可能性。


在奥斯卡颁奖典礼上,韩国电影《寄生虫》导演奉俊昊说:「当你解决的时候 1 高大的字幕阻碍了你,你会看到更多精彩的电影。」


如果生活中出现了电影中常见的字幕,它就能让有需要的人看到更多的信息,并且有权不退出对话。



Google 的翻译 AR 眼镜片里有一句话很感人:我直视着你的眼睛,你看上去也直视着我的眼睛。


科学技术的最佳状态是几乎没有存在感。


在保证效率和准确性的前提下,沟通可以回归自然,不占用双手,不需要低头玩手机,不需要一直盯着嘴唇,而是零距离接触眼睛,就像几千年前一样。


本文来自微信公众号“爱范儿”(ID:ifanr),作者:发现明天的产品,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com