小小的我,大AI。

01-04 07:49

刘春和只是脑瘫,不是傻瓜。


看完《小我》,很高兴影视剧能正视阻碍群体的真实情况。试着向公众普及他们的客观情况和需求,而不是盲目地给他们贴上“悲惨”和“励志”的二元化标签。我相信一部电影可以打破这些刻板的偏见,背后是无数声音的总结和凝聚。



作为一名科技作家,最重要、最荣幸的工作之一就是无障碍地为大家工作。在讨论了很多科技无障碍项目,采访了很多相关客户之后,经常会有这样的感叹:随着科学技术的飞速发展,以极高的速度支持医疗、康复和无障碍工作。但是这些结果,一般都是有需要的朋友不了解的,大众对此更是生疏。


我们经常会遇到这样的情况,一个被视为困扰个人一生的问题,可能会突然有技术手段作为解决方案。这种方法可能在上半年还在实验室,下半年可以大规模应用。


所以,去讨论和叙述科技无障碍的最新成果,永远是必须要完成的工作。这项工作没有截止日期,必须终身服役。


比如这两年是AI模型的集中爆发期。这种技术趋势给无障碍工作带来了很多升级。在本文中,我们将列出一些AI。 最新的无障碍工作进展。


这几个故事的主题,都是小我,如何拥有大AI。


世界上最初的善良


首先,刘春和所面临的脑瘫。


脑性瘫痪是一种必须尽早发现、尽快干预治疗的疾病。与此同时,如果病人在成长过程中逐渐发现脑瘫的症状,也会给父母和学校的教育带来很大的挑战。所以,婴幼儿是观察和识别脑瘫的最佳时机。但是它的临床判断方法,往往是通过观察婴幼儿的细微动作和反应来诊断。这种情况需要依靠医生的分析经验,导致误诊和误诊的几率很大。同时,观察和识别脑瘫儿童也需要十分严格的训练,这导致具有相关资质的医生十分罕见。病人及其家属很难在医疗条件相对较弱的地区得到类似的支持。


但是捕捉动态模型,并进行分类判断,正好就是AI的特长。多年前,学术界开始尝试用机器视觉方法识别早期脑瘫。



现在,AI脑瘫识别的正确性和完成效率在模型的加持下得到了显著提高。这项技术也从实验室阶段走向了临床。一些三甲医院已经开始购买脑瘫初期的AI预测辅助系统。相信在不久的将来,AI脑瘫识别将在基层医院普及,处理基层医疗系统脑瘫儿童识别能力不足导致的医生力量不足的关键问题。


孩子来到这个世界,首先要体会到科技的善意。AI技术除了脑瘫识别外,还从多个角度推动智能儿童保健系统的升级迭代,让可能困扰儿童生活的健康问题在婴儿期被发现、矫正和治疗。


但是在更远的未来,通过AI 脑机器接口的搭配帮助以脑瘫为代表的瘫痪病人恢复感觉,重新获得运动能力的可能性,也已在实验室反复打磨。


健康,一定是AI真正应许的地方。


用尽全力的声音


不久前,我刷了一个短视频。视频中的听障女孩用手机修复了声音,平静地完成了日常生活,包括咖啡店订购。科技带来的变化是多么美好,在这一刻得到了完美的诠释。


仅在中国,就有2700多万听力障碍者和2亿65岁以上的老年人。他们中的许多人因为听力障碍影响了他们的语言能力,导致了语言障碍。助听器等设施可以帮助他们听到,但很难帮助他们准确发出声音。这使得听力障碍、语言障碍者和许多老年人仍然很难沟通。



在今年,HarmonyOS华为 在NEXT中,推出了小艺声修复功能。该技术可以利用鸿蒙系统的原生智能实时分析、修复和提高用户输入的声音,从而导出高可理解度的清晰声音。同时,小艺的声音修复可以尽可能保留客户的音质,增强用户的体验。


在语音识别大模型和语音合成大模型的加持下,小艺语音修复功能可以满足四级和三级语音障碍的修复需求,实现无门槛体验。为了满足这个功能的实用性,华为团队邀请了3700名语障用户参与测试,实现了80%以上的可理解性阅读效果。



移动电话是离我们最近的科技产品,也永远是科技无障碍工作的第一线。现在,AI识图、读屏软件已成为视障人士生活中的必需品。主流软件的无障碍操作也在不断进化。曾与一位视障开发者朋友讨论过手机的无障碍升级。他提到了两个趋势,第一,手机的无障碍能力曾经是苹果的世界。因此,很多听障、视障的朋友都必须购买昂贵的苹果手机。但是如今,随着华为、vivo等国产手机品牌不断重视无障碍的感觉,苹果的主导地位已经完全改变。甚至苹果在这方面的升级也是传统的。第二,很多能帮助阻碍人群的功能都停留在具体的应用上,但是在实际应用中调用无障碍功能的体验很差。所以如今,相关功能的开发者也更多地与手机品牌的第一方合作,将这些功能集成到系统自带的功能或负屏、快速应用等端口。,最好是通过语音助手、快捷键等方式呼出。


移动电话制造商,开发者,AI技术人员,以及语障朋友的共同努力,最终使一个声音得到精确修复。


或许下一个需要使用这个功能的人会知道,这是世界竭尽全力帮助他们发出的声音。


披荆斩棘代码


众所周知,视障人士就业的第一大方向是按摩师。但是第二大是什么呢?


很多人不知道答案是程序员。与其他工作相比,软件编程对视觉的需求更低,整体效益更高,人才缺口更大。因此,在中国和相关协会的推动下,编程逐渐成为视障人士的全新就业选择。


即便如此,编程对于视障人士来说还是很辛苦的。屏幕阅读软件可以帮助解决一些问题,但是对检查代码、定位信息等需求仍然困扰着视障人士的工作。此外,屏幕阅读软件无法阅读图片上的信息,这也给视障编程人员带来了很多麻烦。


为了让视障人士在代码之旅中跨越差距,不久前,百度智能代码助手文心快码联合信息无障碍研究会推出了“文心快码无障碍版”。



该系统可以将代码转换成流畅的自然语言,从而帮助视障人士快速定位代码,完成搜索、审批等功能。此外,还可以提供一系列方便的指令,帮助用户定位需要修改的代码段。在用户输入自然语言描述后,文心大模型提供的AIGC能力可以一键生成运行代码。,这样可以大大提高视障人士的编程效率,使他们能够走向一个体面、高收入、充满无限可能的岗位。


AIGC代码生成本身就是大模型带来的核心能力之一,这种能力与无障碍开发有着天然的契合点。文心快码已经成为中国第一个支持无障碍研发的编程工具,我相信这只是一个开始。



从这些故事中不难看出,AI模型正在与行业、终端和开发工具深度结合,进而在医疗康复、日常生活、工作和创业等领域给阻碍群体带来全新的能力支点。


大AI,也许只是一个小工具。但是它可以让不公平的命运稍微公平一些,让湍流中的生活稍微平静一些。


这让我们很小,毕竟相信这个世界可以变得更好。


本文来自微信微信官方账号“脑极体”(ID:作者:风辞远,36氪经授权发布,unity007)。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com