
利用AI和相机的视觉技术再次带来了新的创新。语音AI拍照应用〈Seeing AI〉的Android版本已经推出,可以将我们日常无意识看到的世界场景进行语言化。
该应用自2019年起已为「iOS」「iPadOS」提供服务,此次发布后也可在「Google Play」商店获取。目前支持18种语言,计划在2024年扩展至36种语言。
迈向视障人士支持的未来
〈Seeing AI〉通过智能手机的相机识别周围的景象,并通过语音提供信息。因此,它可以帮助视障人士阅读邮件、识别商品、听取照片的语音描述。
利用〈Microsoft〉的Cognitive Services,能够实时显示目标物的结果。这使得视障人士可以通过智能手机实时访问世界。

© Microsoft
基于AI技术的认知能力,将视觉信息转化为语音的〈Seeing AI〉具备识别文字、文章、条形码、人物、景观、货币、颜色、光线等功能,尤其是“短文本”、“人物”、“颜色”、“光线”等信息识别功能可在离线环境下使用。此外,该应用还实现了利用〈OpenAI〉的〈ChatGPT〉的新功能,可以通过〈ChatGPT〉解析文档的文字识别结果。
作为认知装置的照片
这超越了传统照片主要被视为记录装置的框架。〈Seeing AI〉关注照片性质的转变,着眼于通过照片认知信息的机制。作为将视觉信息转换为听觉信息的认知装置,期望能够解决视障人士在信息可访问性方面面临的挑战。
长期致力于可访问性
〈Microsoft〉在过去30多年中一直提供与可访问性相关的服务,此次的〈Seeing AI〉也是其中的一部分。〈Seeing AI〉应用设计简洁,即使看不见也能熟练操作,许多功能集成在一个应用中。
这样的可访问性应用支持视障人士在日常生活中的各种活动,并通过其便利性提供新的社会参与机会。利用AI技术的可访问性支持随着时代的发展愈发重要,而〈Microsoft〉的努力在其中发挥了作用。展望视障人士支持的未来,〈Seeing AI〉正在开启可访问性的新纪元。