magazine
2024.09.04

語音相機應用程式〈Seeing AI〉 | Release #44

2023-12-seeing-ai-cover-image

運用AI和相機的視覺技術再次帶來新的創新。語音相機應用程式〈Seeing AI〉的Android版本已經推出,能夠將日常不經意看到的世界場景語言化。

該應用程式自2019年起已提供「iOS」「iPadOS」服務,隨著此次發布,現在也可以在「Google Play」商店獲得。當前支持18種語言,計劃在2024年擴展至36種語言。

邁向視障人士支援的未來

〈Seeing AI〉透過智慧型手機的相機識別周圍的景象,並以語音提供資訊。因此,視障人士可以聽取電子郵件、識別商品、聽取照片的描述等。

利用〈Microsoft〉的Cognitive Services,能夠即時顯示目標物的結果,讓視障人士能夠透過智慧型手機即時接觸世界。

2023-12-seeing-ai-image-6

© Microsoft

基於AI技術的認知能力,〈Seeing AI〉將視覺資訊轉換為語音,具備識別文字、文章、條碼、人物、景觀、貨幣、顏色、光線等功能,特別是「短文本」、「人物」、「顏色」、「光線」等資訊識別功能可離線使用。此外,該應用程式還實施了〈OpenAI〉的〈ChatGPT〉新功能,能夠使用〈ChatGPT〉解析文件的文字識別結果。

作為認知裝置的照片

這超越了傳統照片主要作為記錄裝置的框架。〈Seeing AI〉注重照片性質的轉變,著眼於透過照片認知資訊的機制。作為將視覺資訊轉換為聽覺資訊的認知裝置,期望能解決視障人士在資訊無障礙方面的挑戰。

長期致力於無障礙的努力

〈Microsoft〉已提供無障礙相關服務超過30年,此次的〈Seeing AI〉也是其中一環。〈Seeing AI〉應用程式設計簡單,即使看不見也能熟練操作而不出錯,許多功能集成在一個應用程式中。

這類無障礙應用程式支持視障人士在日常生活中的各種活動,並因其便利性提供新的社會參與機會。隨著時代的進步,運用AI技術的無障礙支持越來越重要,〈Microsoft〉的努力在其中投下了一塊石頭。展望視障人士支援的未來,〈Seeing AI〉開創了無障礙的新時代。